«Тошнота» страницы. Что это такое? Как проверить и оценить? Академическая тошнота документа

Здравствуйте, уважаемые читатели, хочу сегодня рассказать вам про тошноту текста. Вы 100% слышали об и тошноте текста, если вам приходилось на заказ на бирже контента Адвего или какой-то . То и дело некоторые вебмастера требуют от вас придерживаться определенного значения этого показателя, а некоторые не выставляют подобных требований. С чем же это связано и какой вообще должна быть тошнотность текста? Сейчас вы всё-всё-всё об этом узнаете.

Кстати, если вы хотите начать продавать статьи на Адвего или писать их на заказ, то вам нужно пройти .

Что такое тошнота текста по Адвего?

Кстати говоря, тошноту вашего текста можно проверять не только на Адвего, но этот сервис очень удобен и к тому же очень популярен. Поэтому я буду привязываться пока к нему.

Тошнота текста – это количество повторяющихся слов в статье. Существует условная норма для того, чтобы текст был удобочитаемым и оставил о себе приятные ощущения. Если плотность ключевых слов в тексте сильно выше или сильно ниже нормы, то это влечет за собой некоторые неприятные последствия.

Чтобы проверить текст на тошноту, зайдите на Адвего в СЕО анализ текста

Если плотность повторяющихся слов слишком низкая, то теряется логическая цепочка такого текста. Как будто, разные куски статьи написаны о разных несвязных вещах. В то же время, если плотность некоторых слов будет слишком высокой, то вы просто не сможете читать такую статью. Это говорит об узком словарном запасе автора материала или о преднамеренной нашпигованности текста ключевыми запросами, что тоже оставляет не очень приятные ощущения при чтении.

Разделяют два типа тошноты по тексту: классическая и академическая. Они отличаются формулой расчета. Но ориентируются чаще на академическую, так как она более точно отражает саму суть плотности слов в вашей рукописи.

Классическая тошнота текста – показатель количества использования самого частого слова в статье. Рассчитывается извлечением корня из количества повторений слова. Допустим у вас в тексте слово «балкон» употребляется 16 раз, значит, классическая тошнота вашей статьи будет иметь значение 4. Это не слишком показательно, потому что, получается, этот коэффициент будет напрямую зависеть от длины статьи.

Академическая тошнота текста – показатель плотности употребления слов. Главное отличие от собрата в том, что тут учитывается размер статьи. И это очень важно. А что касается формулы расчета, то вы нигде не найдете настоящую формулу. Есть только догадки людей, которые сами попытались ее вывести. Но они все неверны (хотя доля истины в них есть).

Допустимая тошнота повторяющихся слов в тексте. Норма

Если вы копирайтер или рерайтер, то ваша норма будет та, которую укажет вебмастер в техническом задании. Если он скажет, что академическая тошнота должна быть в пределах 2-7%, то так вы и будете подгонять текст.

Но совсем другое дело, если вы сами вебмастер. Тут уже нужно задуматься, каких цифр придерживаться и к кому прислушиваться. Естественно, поисковые системы не раскрывают секретные формулы алгоритмов ранжирования, а только намекают на них. И тут в дело вступают СЕО оптимизаторы. Путем анализа статистики они выводят различные допустимые нормы тошнотворности сказаний копирайтеров.

Шутка в тему. Примерно так выглядит переоптимизированный текст

И эти нормы у всех отличаются, хотя и приблизительно похожи. Они варьируются от 2% до 10% для академической тошноты. Но при этом, многие еще придерживаются тошноты классической и полагают, что она не должна превышать 3-5%. И ко всему прочему нужно следить, чтобы частота любого отдельного слова не превышала 3%.

Анализируя этот сайт digital- boom. ru , я лично сделал выводы, что у меня лучше всего ранжируются статьи, тошнота у которых (академическая) достигает 12%. Это, согласитесь, немного отличается от рекомендаций СЕО оптимизаторов.

Поэтому я буду придерживаться следующих значений:

  • Академическая тошнота – 6-11% (в этой статье – 10,3%);
  • Классическая тошнота – до 5 баллов (в этой статье – 4,24);
  • Частота слова – до 3% (в этой статье – 2,96%).

Напишите в клмментариях и мы обещаем исправиться!

Для продвижения многих типов сайтов нужны тексты, но далеко не любые. Само собой, полезные, где-то - продающие, где-то - максимально подробные, интересные. Но как бы ни уверяли, что писать нужно для людей, некоторая ориентация на поисковых ботов тоже должна быть. SEO-копирайтинг помимо других критериев ориентируется на «тошноту».

Что такое тошнота текста

Это чувство, которое возникает при прочтении типичной сео-портняки. Шутка 🙂 Но, как говорится, в каждой шутке… Вот пример:

У этого фрагмента:

  • Академическая тошнота - 16,5%
  • Классическая тошнота - 3,32%

Академическая - это отношение повторов самых частотных слов к их общему количеству. Зависит от объема текста.

Классическая - равна квадратному корню из числа употребления самого часто встречающегося слова. Не зависит от объема.

Чем меньше текст и больше в нем повторов, тем менее естественно он выглядит. Будет тяжело читаться, появится ощущение, что автор пытается гипнотизировать случайных посетителей сайта 🙂

Поисковых ботов тоже будет тошнить от того. Очевидно, что владелец сайта сильно старается, чтобы страничка находилась в выдаче по запросу, но вовсе не думает о людях, которым придется это читать.

Тошнота и «Баден-Баден» Яндекса

Между какими-то значениями классической тошноты и попаданием под фильтр Яндекса «Баден-Баден» закономерности не видно.

Чего не скажешь об академической. Что понятно: чем больше ключевиков стараться впихнуть, тем выше будет это значение.

Обратите внимание:

Я сейчас не говорю, что по тошноте можно судить о риске попадания под «Баден-Баден». Для него важнее оценивать «воду», плотность биграмм, триграмм. Но повод задуматься определенно есть.

Тошнота, LSI и естественные тексты

Встречается мнение, что для LSI не важна тошнотность. Пишите, максимально раскрывая тему, добавляйте тематические слова и все. Ну нет.

Я считаю, что контролировать тошнотность нужно в любом текстовом контенте, созданным для SEO, будь это олдускульный SEO-копирайтинг или более «естественный» LSI.

  • Не все «естественное» прекрасно. LSI также пишется для SEO, поэтому игнорировать какие-то критерии кажется странным;
  • LSI в практике и в теории - разные вещи. По факту видно, что под LSI сейчас продают тот же SEO, только без нелепых неестественных вхождений, а к списку обычных ключей добавляются тематические слова, к которым копирайтерам нужно вписывать как классические ключевые;
  • Текст с высоким показателем тошнотности читать сложно. Каким бы полезным, раскрывающим тему он не был, нужно, чтобы легко читался.

Обратите внимание:

Даже в самом естественном тексте, написанному без ТЗ и мысли о SEO, возможны проблемы. Непреднамеренные повторы, тавтологии - все это может негативно сказаться на ранжировании страницы и удобстве пользователей.

Тошнота по слову

В ТЗ на SEO-копирайтинг может встречаться такое. Это просто частотность или плотность, кто как называет. То, что непосредственно влияет на спамность.

Вернемся к примеру из скриншота:


То, что здесь называется «частотой» - это и есть тошнота по слову, фразам. Глядя на это, сразу видно, под какие запросы оптимизируют страницу.

Как проверить

Показатель фундаментальный, проверяется любым анализатором текста. Онлайн, бесплатно, за пару секунд 🙂

Думаю, навряд ли ошибусь, назвав наиболее популярной проверку по Адвего . С него был скриншот выше, вот еще один:



У него построже проверка, отдельно можно увидеть статистику по словам без учета стоп-слов.

Еще есть ну очень крутой сервис «Тургенев » с массой полезностей:


И еще вагон и тележка 🙂 Но я пользуюсь этими.

Сколько вешать в граммах: какая должна быть нормальная тошнота

Вот на этот вопрос нельзя дать однозначный ответ. Все зависит от приоритетной поисковой системы, уровня конкуренции, тематики, особенностей топа, конкретных ключевиков.

Но есть усредненные нормы, считающиеся близкими к идеальным для большинства случаев:

  • Классическая - 3-4%;
  • Академическая - 7-8%;
  • По слову - до 3%;
  • По фразе - до 2-3%.

Но это общие показатели. И, естественно, зависят от сервиса проверки. Эти ориентируются на Адвего.
На деле все может обстоять ни так. Перебор грозит переоптимизацией, недобор - недостаточной релевантностью.
Есть распространенный прием - смотреть значения по топу. В этом есть смысл, но я бы не рекомендовала всецело на него ориентироваться.

Что позволено Юпитеру, не позволено быку:

Страница в топе может находиться не только из-за каких-то особенностей текста. Например, может висеть там даже со спамом из-за солидного возраста, кучи входящих ссылок или того, что миллион страниц сайта посвящено теме, а на других только сотня. Короче, много и-за чего.

В эпоху «Баден-Бадена» главное, чтобы текст был максимально полезен, выглядел естественно, поэтому обычное прочтение на несколько раз может заменить любые сервисы онлайн-проверок.

Как снизить тошноту текста

Если проверка выявила перебор, нужно уменьшить значения. Для этого отталкиваемся от определений:

  • Классическую снижаем, уменьшая количество вхождения самого частотного слова;
  • Академическую уменьшаем, увеличивая объем текста и/или снижая количество вхождений уже вписанных слов.
  • По слову и фразе – уменьшаем число вхождений и/или увеличиваем объем.

Лайфхак:

Прежде всего, начинайте чистить стоп-слова. Так и желаемого можно добиться, а заодно «воду» отжать, читаемость повысить и т. д.

Привет всем начинающим авторам! Сегодня я познакомлю вас с ещё одним интересным понятием из мира копирайтинга и продвижения - заспамленностью (переспамом). Если вы хотите заниматься SEO-оптимизацией сайтов или писать крутые статьи, то садитесь поудобнее и готовьтесь узнать, что такое тошнота текста.

Никто из нас не рождается опытным копирайтером. Когда я впервые увидела в ТЗ “тошнота не более …%” - испугалась. А что это? Вдруг получится больше, чем надо? Как уменьшить? - эти страхи сильно тормозили выполнение работы.

Сейчас я без проблем набиваю текст без переспама. Проверяю только в конце, результатом остаюсь довольна без серьёзных правок. Годы за печатным станком не прошли даром.

Термин “тошнотность” ввели в 2006 году. Тогда начал меняться подход поисковых систем к контенту. Раньше можно было напичкать текст ключевыми словами через каждое предложение и он попадал на вершину топа поисковиков. Теперь же нужно писать для людей - кратко, понятно, полностью отвечать на вопрос.

Тошнота - это количество употреблений слов относительно всей статьи. Считается в процентах. Например, если слово “пластик” встречается 35 раз в работе объёмом 3 000 символов, уровень переспама по слову будет 11 %.

Здесь я научу вас работать с показателем, доводить его до нормы.

Виды

Некоторые сервисы проверяют тексты на несколько видов тошнотности.

На практике есть 2 типа заспамленности:

  1. Классическая тошнота - корень квадратный от общего количества употреблений слова в статье. Допустим, “поезд” вы написали 25 раз в статье, какой будет показатель? Правильно, 5. Заказчики редко требуют соблюдать её.
  2. Академическая тошнота - отношение часто употреблённых слов к объёму работы. Помните, как в школе мы узнавали пропорционально количество процентов или предметов с одной неизвестной? Здесь всё так же. Если “кондитер” встречается 7 раз в 5 000 символах, то тошнотность будет равна 7*100/5 000 = 14 %.

Соблюдение этих показателей помогает сайту быстрее выйти в ТОП поисковой выдачи и избежать фильтра Баден-Баден в Яндексе.

Норма заспамленности

Никто не знает на 100 %, какой должна быть тошнотность, чтобы сайт не попал в чёрные списки поисковиков. Примерная норма вычислялась методом тыка. Оптимизаторы анализировали контент самых успешных сайтов, копирайтеры вычитывали и предлагали разные варианты.

Какая должна быть тошнота в идеале:

  1. Академическая — в пределах 7 — 9 % по Адвего, до 45 % по Текст.ру и не более 7 % на Миратексте.
  2. Классическая — не более 7 %. Менее 2,7 % у вас не получится, даже если слово употреблялось 6 раз, корень будет извлекаться из 7.

Для проверки качества текста на глаз можно анализировать страницы конкурентов.

Перечитывайте свою работу. Если она слишком объёмная, делайте перерывы. Чем дольше вы сидите над статьей, тем больше тавтологии получится.

Как понизить академическую тошноту?

Во время чтения статьи поняли, что с ней что-то не так? Проверили на заспамленность и получился высокий показатель? Нужно срочно избавляться от слов-повторюшек.

Чтобы академическая тошнота была допустимой, можно:

  • Заменить или убрать высокочастотные слова/фразы

Воспользуйтесь сервисами подбора синонимов, например, Орфограммкой или синонимайзером . Следите, чтобы они не выходили из контекста. Если много стоп-слов, их лучше убрать, перестроив предложение. Удалив их, вы понизите водность. Как проверить воду в тексте - узнаете в следующей статье.

  • Увеличить размер текста

Не всегда уместно. Если вас попросили написать описание товара для интернет-магазина до 1 000 символов, вы не сможете растянуть его до 5 000. Посмотрите, сколько ключей попросил вписать заказчик. Не более 5? Нормально. В других случаях снизить заспамленность и соблюсти ТЗ - невозможно.

Тошнотность не бывает нулевой.

Теперь хочу на практике показать, что методы работают. Для примера возьму отрывок из народной сказки “Снегурочка”. Анализ буду делать через Адвего. Что поделать, привыкла к нему.

Результат для SEO ужасен - 9,4 %. Попробуем с помощью замены, перестройки предложений уложиться в 8 %, сохранив смысл.

Из таблицы семантического ядра узнаём, что переспам вызван частым употреблением слов “все”, “снегурка”, “баба”, “в”, “и”, “а”.

Мне удалось понизить тошнотность до 7,1 %. А по слову она теперь не превышает 2,5 %.

Что я сделала? Удалила слова, изменила предложения.

Оптимизация сказкам не нужна. Мы любим их не за это. В народных сказках одни и те же слова встречаются часто, вот и взяла для примера.

Как уменьшить классическую тошноту?

Она измеряется по самому популярному слову в статье. Нельзя употреблять одно и то же слово более 15 раз.

Как снизить классическую тошноту:

  • Сократить количество повторяющихся слов

Посмотрите на таблицу семантического ядра. То слово, которое видите на первом месте, нужно убрать. Сервис для проверки на тошноту подскажет, как сделать лучше.

  • Уберите стоп-слова

Тошнотность может подлетать до небес из-за союзов - “по”, “для”, вводных конструкций - “конечно”, “к примеру”, “однако”. Они не красят текст, их уменьшают для читабельности.

Чем больше статья, тем выше классическая тошнота получается.

Как бы не хотелось написать одно и то же слово снова, старайтесь останавливать себя. Иначе конечная проверка разочарует.

Что делать, если тошнотность слишком маленькая?

Думали, что только переспам заставляет опуститься страницы на дно поисковиков? Нет. Если тематических слов будет недостаточно, поисковый робот подумает, что статья не отвечает запросу. А ключи и вовсе попали туда случайно.

Как повысить тошноту? Единственный способ - добавить еще 2 — 5 вхождений, в зависимости от размера статьи.

Где проверить на заспамленность - подборка лучших сервисов

Можно проверить текст на тошноту самостоятельно. При вычитке лишние слова портят впечатление о статье, создают впечатление лишнего.

Но перечитав 4 — 5 работ, вы начнёте пропускать ошибки. Почему? Снижается внимание, вы привыкаете к переизбытку одних и тех же слов.

Если вы усидчивый человек, любящий математику, то можно рассчитать заспамленность по формуле:

ЧС/ЧЗ*100 = Т%, где

ЧС - частота слов,

ЧЗ - общее число знаков,

Т% - тошнота в процентах.

У копирайтера не так много времени, чтобы тратить по 3 — 5 часов на проверку одной работы. Легче воспользоваться онлайн-сервисами, программами.

Для наглядности я буду делать анализ одного и того же текста, страницы сайта.

PR-CY

Документ анализируется по закону Ципфа. Согласно ему положение слова пропорционально его месту в тексте. Например, “компот” будет стоять на 2 месте, если оно встречается в два раза реже.

Чтобы перейти в раздел проверки, нужно на главной странице на панели кликнуть “Инструменты”. Там выбираем “Анализ Ципфа”.

Вы можете отправить на проверку готовую страницу сайта или документа. Просто вставьте статью в пустое поле. Максимальное количество знаков - 15 000, минимальное - 100.

Я получила такой результат. Тошнота до 7 % - отлично. Естественность для поисковиков хорошая. Квадратики показывают рекомендации. Красные - уменьшите количество указанного слова, зелёные - добавьте.

Я решила не останавливаться на достигнутом и проверила готовую страничку сайта.

Заспамленность зашкаливает. На первых позициях какие-то непонятные словечки из меню.

Показатели по Ципфу страницы и статьи - разные. Когда анализируется сайт, учитываются не только слова из вашей работы, но и всё, что видимо для пользователя - “Контакты”, “О компании” и др. Добиться нужных результатов сложней.

Я некоторое время работала в офисе копирайтером. Меня гоняли по этому показателю. Мне казалось нереальным выбить в первую десятку необходимые слова по странице. Уходило по 3 — 4 часа на работу в 2 000 — 2 500 символов. Но с опытом стало проще.

Удобная навигация, подробная статистика - хороший сервис, которому можно доверить текст.

Text

Оказывается, уровень переспама оценивают и по Текст.ру . Во время работы в компании я отталкивалась от этих показателей.

До 50 % норма, но требовательные заказчики просят не более 40 %.

Чтобы проанализировать документ, переходим по вкладке “SEO анализ”, вставляем его в рабочую область, нажимаем “Проверить SEO-данные”.

Тошнотность 49 % - не очень. Тёмно-фиолетовым выделены слова с высокой частотностью: “ребёнок”, “брокколи”. Бледные — низкочастотные: “белок”, “развиваться”.

Подробная статистика помогает быстро очистить статью от тавтологии. Правда, ждать ответа от сервиса приходится долго. Адвего, PR-CY работают шустрее.

Адвего

Адвего - ветеран по проверке семантического ядра. Большинство заказчиков просят равняться по его показателям. Анализ не требует установки ПО, результаты выдаёт за несколько секунд.

Как узнать заспамленность? Сейчас разберёмся. Заходим сразу в семантический анализ текста Advego , чтобы долго не блуждать по сайту. Вставляем текст, запускаем проверку нажатием кнопки внизу.

Академическая тошнота 8.2 %, классическая — 3.74. Приемлемо, но могло быть лучше.

Если фраза повторяется 3 — 4 раза, она отражается в семантическом анализе целиком.

Ниже мы видим количество стоп-слов.

Это текстовый мусор, по возможности удаляем лишнее.

Люблю Advego, полагаюсь на него. Никогда не подводил.

Istio

Istio не хуже Адвего, просто не популярен. Даже разница в показателях на сотые.

Выбираем вкладку “Анализ текста”, вставляем текст в рабочую область, запускаем проверку, нажав на синюю кнопку “Анализ”.

Хотите знать число вхождений ключевых слов, их расположение? Вводите ключи через запятую в строку над кнопками.

Мне показало тошнотность без предлогов, вводных конструкций. Если вы хотите узнать полную статистику, выбираете вкладку “Со стоп-словами”.

Сервис работает быстрее Advego. Есть все необходимые инструменты для копирайтеров и заказчиков.

Textus PRO

Хотите иметь SEO-помощника под рукой? Надоело постоянно открывать онлайн-сервисы? Тогда ПО Textus PRO — ваш вариант. Скачиваете установочный файл. Он весит 600 Кб, ставите на ПК за 2 минуты.

Активируете после установки, кликнув на ярлык рабочего стола. Интерфейс программы прост. Вставляете текст, сразу получаете готовый результат.

Высокая заспамленность? Будете редактировать? Для удобства можно поставить галочки вверху. Они замажут стоп-слова, знаки препинания, которые отвлекают вас.

Справа находится подробная статистика. Показана классическая тошнота. Проверка настраивается. Есть возможность отключить подсчёт чисел, стоп-слов.

Статистика фраз и слов помогает узнать количество точных вхождений - видны в таблице. Они подсвечиваются синим. Если показатели не соответствуют ТЗ, с лёгкостью заменяйте их на синонимы, убирайте.

Miratext

Долгое время не догадывалась, что у Миратекст есть собственный сервис проверки. Так хорошо его спрятали. Искала в поисковиках. Чтобы вы не накручивали круги в поисках этого инструмента, даю ссылочку на семантический анализ текста от Миратекст .

Мы можем проанализировать документ, целую страницу сайта. Миратекст ведёт статистику по закону Ципфа, более сложной версии проверки на заспамленность.

Вводим текст, нажимаем на кнопку.

Получаем подробный результат.

Вверху простенькие, обобщённые данные - тошнота, число знаков, естественность текста по Ципфу для поисковых систем.

Моё любимое - ТОП 20 самых употребимых слов. Для оптимизации сеошники просят копирайтеров, чтобы в десятку попали тематические ключи. Для сайта про двери нужно вывести в лидеры “двери”, “межкомнатные”, “входные”, “купить”, “цена”, “интернет-магазин”, “каталог” и т. п.

Как писать без переспама сразу?

Ох, эта тошнотность. Пишешь-пишешь, проверяешь онлайн, а потом ещё 2 часа правишь.

Чтобы не делать работу над ошибками, следите за потоком слов. После каждого 4 предложения задумайтесь - не повторяетесь ли вы.

Избежать заспамленности помогают перерывы, чтение книг. Читайте любую литературу - художественную, узкоспециализированную. Вы отвлечётесь от темы, в голове родятся новые фразы.

Чтобы не тратить драгоценные минуты своего времени на анализ текста, советую . Вы научитесь писать красивые, полезные статьи без переспама.

Заключение

Тошнота текста - важный показатель. Никогда не шутите с ним. Для копирайтеров переспам закончится доработками и отказами, а для вебмастеров, владельцев сайтов - выходом из поисковой выдачи.

Проверяйте статью по семантике в ходе работы, если чувствуете неестественность, или оставляйте это напоследок. Уменьшить, увеличить тошнотность можно всегда. Главное — вовремя на это обратить внимание.

Дорогие копирайтеры, на этой ноте я прощаюсь с вами. Пишите в комментариях своё мнение о переоптимизации текстов.

Если вам нравится изучать мир SEO и копирайтинга вместе с нами, . До встречи!

Мы выпустили новую книгу «Контент-маркетинг в социальных сетях: Как засесть в голову подписчиков и влюбить их в свой бренд».

Подписаться

Тошнота текста - это частота использования какого-то слова в тексте.

Тошнота учитывает повторение каких-то слов, синонимов. В рассмотрение берутся не только ключевые фразы, но и синонимы.

На Новый год вы съели очень много мандаринов. И вас начало тошнить. Больше в вас не лезут ни мандарины, ни апельсины. На все цитрусовые рвотный рефлекс.

Манадаринов оказалось слишком много. Если считать мандарином какое-то слово со всеми синонимами, то в тексте это и будет тошнотой. Переизбыток повторяющихся фраз.

Влияние на SEO

Когда алгоритмы ранжирования стали учитывать не просто плотность ключевых слов, но и общее число повторений фраз, был введен термин “тошнота”.

Соответственно, чем этот показатель меньше, тем выше ранжируется страница в выдаче. Однако это не такой важный показатель, как текста или водность.

Виды тошноты

Специалисты выделяют всего два основных вида тошноты материала, потому и говорить мы будем именно о них.

Классическая

Отлично иллюстрирует и обозначает, что это – классическая тошнота текста, сервис ресурса «Адвего», а именно семантический анализатор https://advego.com/text/seo/. Она равна квадратному корню из количества повторений слов или фраз. К примеру, если любое слово встречается на странице 25 раз, то тошнота по нему составит ровно 5. Такое значение находится в пределах нормы, если весь объем текста без пробелов составляет не менее 8-10 тысяч символов.

Тексты малого объема должны проверяться еще более тщательно, так как искусственно добавленные ключевые слова и фразы станут для него губительны при проверке поисковыми роботами.

Важный вопрос, какая должна быть тошнота текста, чтобы он не был воспринят поисковыми машинами, как спам. В пределах нормы «классика» считается показатель от 1 до 5. Максимально допустимое значение такой тошноты завершается семеркой. Во всех иных случаев роботы сочтут ваш текст машинным, с жутким переспамом, что сразу же может понизить страницу в рейтинге по степени релевантности.

Академическая

Специально для этого показателя была разработана формула, определяющая академическую тошноту текста, в процентном соотношении к иным словам в статье или ином тексте. Она подразумевает правильно вычисленное отношение (в процентах) ключевых запросов к фразам и словам, не являющимся ключевыми. Для полноты понимания давайте предоставим конкретный пример расчета данного показателя, составив простейшую математическую пропорцию.

  • 18 вхождений – Х%.
  • 780 слов – 100% текста.
  • Х = 100*18/780 = 2.307%
  • Х = 2.305=7%

Таким образом, получается, что проверка текста на тошноту по специальному сервису должна выдать именно эту цифру, что находится в пределах нормы. По сути, именно академическую тошноту можно по праву считать прямым указанием на частотность вхождений.

Основная ошибка

При написании текстов считается чрезмерное употребление ключевых запросов, слов и фраз. Из-за этого получается крайне нежелательная, высокая тошнота документа, что ранее давало весомый результат, но с развитием новых сервисов сошла на нет.

Измеряем уровень тошноты текста

Наиболее простым методом проверить любой текст на тошноту, как академического, так и классического плана, это просто высчитать вхождения, отыскивая нужные слова и фразы вручную и подсчитав все результаты. Но это заставит потерять много времени и сил, что не всегда удобно. Потому есть смысл обратить внимание на разнообразные сервисы в сети, большинство из которых работает на совершенно безвозмездной основе.

Программа TextusPro

Достаточно скопировать нужный текст и вставить его в специальное окошко приложения, а тогда оно само высчитает все нужные вам показатели. Кроме тошноты этот сервис предоставит возможность проверить и иные показатели текста, так что удобство ее налицо.

Онлайн-сервис биржи «Адвего»

Все проверки, кроме уникальности текста, для чего имеется отдельная программа, будут проводиться прямиком в браузере вашего компьютера. Причем в результате проведения такого анализа будет сразу же предоставлено оба показателя – академическая и классическая тошнота.

Сервис поможет значительно упростить задачу, так как он показывает частотность и количество вхождений не только отдельных слов, но и целых фраз, которые безошибочно «выделяет» в статье. Обратите внимание, что максимальным показателем считается 3%, на это стоит обратить особое внимание.

Сервис SEO-прорыв

Тут предлагаются самые разнообразные варианты проверки: одиночные, разовые, пакетные. Сервис реально поможет бороться с переспамом и блокировкой поисковыми роботами.

Тут можно увидеть, какие страницы уходят из поиска, а какие поднимаются, в виде удобной и понятной таблицы. Следить за трафиком можно регулярно, делая «прогоны» подобным сервисом, что вовсе не трудно, удобно и быстро.

Как убрать лишнюю тошноту текста

Проведя проверку текста и вычислив «лишнее», его можно начинать вычищать. К примеру, можно просто заменить чрезмерно часто встречающиеся слова синонимами (есть ), а порой и вовсе убрать из материала. Времени на написание с такими проверками может уйти дольше, но оно того стоит. Не помешает заодно безжалостно вычеркивать тавтологии, отказаться от большинства стоп-слов, все это поможет повысить качество.

Наконец, еще один в меру бесполезный параметр, характеризующий количество «воды» в тексте. Вычисляется очень просто: берем количество незначимых слов и делим на общее число слов в документе. Незначимые — это предлоги, частицы, местоимения, сокращения и прочие словеса, сами по себе не несущие смысловой нагрузки.

Здравое зерно в этом параметре, безусловно, есть. Слишком много «воды» — и вот уже смысл текста теряется в многочисленных «как известно» , «нетрудно вообразить» , «в современном мире» и «молодая динамично развивающаяся компания» . Наоборот, сквозь «сухой» текст вам придется буквально продираться, и об этом знают все без исключения студенты.

Вот только к поисковой оптимизации водность имеет очень опосредованное отношение. Кроме того, характеристика не учитывает тематику текста, его структуру, использованную терминологию. Не говоря уже про метафоры и игру слов. Анализ «Евгения Онегина» на водность дает свыше 70% (при «оптимальных» и всячески рекомендуемых «экспертами» 60%), а стихи Бродского содержат и вовсе под 80% «воды». Это у Бродского-то, с его «многомерными» смыслами!

Скажете, стихи одно, а коммерческие тексты — другое? Верно. Но читают и то, и другое люди. В которых, кстати, тоже воды около 70%.

Доказательства бесполезности

Или, если точнее, иррелевантности вышеописанных параметров. После чего перейдем к лингвистическим характеристикам.

Чтобы понять, какое влияние оказывают плотность (частотность) ключевых слов, классическая и академическая тошнота и водность текста на ранжирование сайта в поиске, я проанализировал первую десятку сайтов в выдаче Яндекса по 5 произвольным запросам: «каршеринг» , «продвижение сайтов» , «дешевые авиабилеты» , «бухгалтерское обслуживание москва» и «копирайтинг на английском» . Для каждого сайта выполнялся расчет корреляции четырех параметров с рангом сайта и выполнялся регрессионный анализ полученных данных на предмет выявления возможной зависимости.

Детали исследования — ниже под спойлером. Кому математика неинтересна — идем сразу к выводам.

[+] Расчет корреляции параметров текста и позиции в поиске

По каждой поисковой фразе я сделал поиск в регионе Москва в Яндексе. Для первых 10 результатов в поиске выполнялись следующие действия:

  1. Открыть сайт.
  2. Нажать Ctrl+A, Ctrl+C.
  3. Вставить содержимое буфера в поле для текста в сервисе семантического анализа текста Адвего.
  4. Записать полученные параметры.

В результате получилось 5 групп по 10 значений каждого из четырех анализируемых параметров. Значения корреляции параметров с позицией в поиске рассчитывались сначала для отдельных ключевых слов, т.е. по группам. Затем были подсчитаны общие коэффициенты корреляции по всей выборке.

Все данные сведены в таблицу. Кликните, чтобы открыть в полном размере.

Корреляция по Пирсону хорошо «ловит» только линейную зависимость или близкую к ней. Поэтому на всякий случай проведем регрессионный анализ данных.

В общем-то, все видно невооруженным глазом. Да, есть некоторые границы значений каждого из параметров, но какой-то явной системы в распределении не наблюдается. Наличие границ как таковых, впрочем, ничего не означает. Если бы мы анализировали не осмысленные тексты, а набор слов — никаких границ не получилось бы, т.к. верхние и нижние значения частотности слов или, скажем, водности, определяются синтаксисом и морфологией языка и структурой текста, а не какими-то алгоритмами ранжирования.

Уравнения регрессии, построенные с максимальной достоверностью аппроксимации, выглядят здесь как чужеродные элементы: хаос он и есть хаос. Достоверность, кстати, намного меньше единицы.

Конечно, анализ не претендует на полноту. Есть к чему придраться: малая выборка, недостаточная глубина значений функции (позиции сайта), смешанные тематики запросов. Вполне возможно, что где-нибудь на 20-ой странице поиска картина сложится кардинально отличная от полученной мной.

Если кто-то проверит и поделится своими результатами, буду благодарен.

Результаты таковы: ни один из рассмотренных параметров не показал достоверной корреляции с позицией сайта в поиске. Проще говоря, ни обе тошноты, ни водность, ни даже частотность никакого заметного влияния на позицию не оказывают. По крайней мере, для сайтов в первой десятке результатов Яндекса по вышеуказанным запросам.

И еще несколько наблюдений.



Что еще почитать