Что такое высокочастотные слова
Высокочастотные и низкочастотные ключевые слова
Поделиться «Высокочастотные и низкочастотные ключевые слова»
Одним из очень важных моментов в процессе раскрутки сайтов считается наполнение его тематического контента ключевыми словами, или, как говорят профессионалы этого дела, ключевиками. От того, насколько умело будут подобраны последние, во многом зависит успех продвижения к “вершинам” поисковиков по поисковым запросам всех пользователей Интернета.
Говоря о ключевиках, нельзя не сказать, что специалисты различают две группы:
Высокочастотники, в основном, представляют собой самые популярные поисковые запросы, встречающиеся в какой-либо сфере. Представители второй группы, наоборот, представляют собой слова, если сравнивать их с высокочастотниками, встречающиеся намного реже в процессе составления интернет — пользователями поисковых запросов по определенной тематике.
Исходя из вышесказанного, можно сказать, что наличие высокочастотных ключевых слов и низкочастотных ключевых слов обусловливает две стратегии поисковой оптимизации веб-портала. Первая базовая стратегия предусматривает наполнение тематического контента, находящегося на сайте, относительно небольшим количеством высокочастотных ключевиков. Вторая система, наоборот, предусматривает внедрение в текстовый материал веб-ресурса многочисленные низкочастотные поисковые запросы.
Отдать предпочтение какой-то из стратегий во время поисковой оптимизации трудно, в связи с этим опытные веб-мастера или сео-оптимизаторы раскручивают свои сайты, прибегнув к услугам обеих базовых стратегий.
В некоторых случаях, все же, по мнению специалистов, лучше отдавать предпочтение одной из стратегий. К примеру, если дело касается молодого, недавно стартовавшего в сети проекта, то в этом случае в его тематический контент рекомендуется внедрять в русле с помощью второй стратегии, то есть большим количеством низкочастотников.
Поделиться «Высокочастотные и низкочастотные ключевые слова»
Высокочастотные запросы
Высокочастотные запросы (ВЧ-запросы) – это слова или словосочетания, которые пользователи Интернета наиболее часто вводят в поиск. Различают также среднечастотные и низкочастотные запросы. Указать точный диапазон спроса, к которому относятся ВЧ-запросы, невозможно, т.к. у каждой тематики он будет свой.
Как определить ВЧ-запросы
Чтобы найти высокочастотные запросы, пользуются специализированными сервисами (самые популярные – «Яндекс.Вордстат» и «Гугл.Адвордс»). Высокочастотники отличаются высоким спросом и общим характером запроса. Например, для тематики строительства домов такими запросами будут являться «строительство из бруса» и «профилированный брус». Словосочетание «строительство из бруса» ищут около 45 тыс. раз в месяц.
Фразу «профилированный брус» – более 77 тыс. раз.
Несмотря на то, что первое словосочетание ищут реже, его тоже считают высокочастотным, т. к. обе фразы имеют обобщенный характер и не отражают четкой потребности пользователя.
Особенности высокочастотных запросов
Что такое ВЧ-запросы в целом, становится понятно, если ввести в форму поиска любое обобщенное слово, например «холодильник». При этом поисковая система может предложить пользователю информацию о том, как купить, продать, отремонтировать, установить, доставить холодильник, узнать особенности его работы или правила эксплуатации. Так как этот запрос имеет обобщенный характер, скорее всего, у пользователя еще не сформировалась четкая потребность. По этой причине конверсия по таким запросам ниже по сравнению со средне- и низкочастотными.
Преимущества использования ВЧ-запросов
Недостатки использования ВЧ-запросов
Технология «Спектр»
Каждый владелец сетевого ресурса должен понимать, что такое высокочастотные запросы и как они работают, прежде чем тратить средства на ВЧ-продвижение с их помощью. К таким запросам поисковая система «Яндекс» применяет технологию «Спектр». Спектральный анализ позволяет удовлетворить потребности пользователя при введении многозадачных запросов: в выдаче показываются разноплановые ресурсы, в том числе из разных категорий (коммерческих, информационных и т. д.). Например, при вводе запроса «кран», в топ войдут сайты и про строительные, и про водопроводные краны. Кроме того, это могут быть и информационные, и коммерческие площадки.
Персонализация выдачи
Во многих поисковых системах работает «персонализированная выдача». На основе предыдущих посещений и запросов он делает выводы о предпочтениях пользователя и в зависимости от них формирует выдачу. В связи с этим продвижение по ВЧ-ключам сильно усложняется. Например, вы продаете бытовую технику и без учета персонализации ваш сайт находится в топе. Но при работающем алгоритме «персонализированная выдача», если посетитель до этого момента уже заходил на другие сайты, продвигающиеся по высокочастотному запросу «бытовая техника», именно эти сайты будут в его топе. Продвижение по среднечастотным и низкочастотным запросам в этом плане более эффективно.
Частотность
Частотность поискового запроса – это количественная величина обращений пользователей по конкретной фразе за расчетный период времени. Простыми словами частота показывает, сколько раз пользователи вбивали в поисковую строку тот или иной запрос в течение месяца.
Частность во многом зависит от направления бизнеса, а также сезонности спроса, региона и алгоритмов расчета поисковых систем. Бесплатные сервисы для работы с поисковыми запросами всем хорошо известны: Wordstat Yandex и Google AdWords. Существуют платные системы и программы определения частотности, например Serpstat, Букварикс, Key Collector и другие. Однако все они, так или иначе, работают с поисковой выдачей Яндекса и Google.
Ключевые запросы различаются по степени популярности среди пользователей, которые ищут ту или иную информацию в интернете. Какие-то фразы вводятся в поисковую строку 1-2 раза в месяц, другие 2-3 тысяч раз, а есть и популярные ключевики с сотнями тысяч показов. Поисковые роботы фиксируют именно частотность фразы, то, как часто она появляется в запросах пользователей.
Зачем нужны эти данные? Практическое применение частности – это анализ и прогноз трафика. Например, специалист по SEO посмотрит выкладку Вордстата по продвигаемому запросу и определит, какой трафик он получит на сайт в ТОПе выдачи. Также ни один специалист не возьмется составлять семантическое ядро сайта без данных по частотности ключевиков. Информация поможет ему отфильтровать нецелевые запросы, «пустышки» на ранних стадиях раскрутки проекта и быстрее вывести ресурс в ТОП выдачи.
Виды запросов по частотности
В SEO запросы распределяются по частотности на три категории. Первая и самая низкая частота – низкочастотные (НЧ). Эти запросы вводят в поисковую строку реже 150 раз в месяц. Вторая позиция – это среднечастотные запросы (СЧ). Ключевые фразы, которые показываются до 1500 раз в месяц. Третья позиция – высокочастотные запросы (ВЧ). В эту категорию попадают все запросы с частотностью от 1500 показов в месяц.
Важно: соотношение частотностей условно. Конкретные значения зависят от выбранной ниши для продвижения. Например, в конкурентных тематиках и 3000 показов в месяц будет низкочастотным запросом.
Запросы с низкой частотой показов обычно имеют узкую направленность и конкретизируют потребность целевой аудитории. Низкочастотники состоят из трех и более слов. Как правило, такие фразы вбивают в поиск люди, которые точно знают, что им нужно.
Например, «где купить куртку из натуральной кожи». Видим, что частотность 102 показа и ниже. Однако в этой нише можно найти многословные запросы с большей частотой.
В любом случае работать с низкочастотными ключами нужно на всех этапах продвижения сайта. SEO специалисты утверждают, что трафик по таким «предметным» ключам пойдет сразу. Чем больше НЧ вы используете в текстах на сайте, тем больше целевого трафика привлечете.
Среднечастотники – это уже менее конкретные запросы, которые состоят из нескольких слов. Чаще всего в среднечастотной фразе 3-4 слова, не более. Показываться они могут до нескольких десятков тысяч раз в месяц. Конкретная популярность зависит от конкурентности ниши.
Например, запрос «купить пластиковый подоконник» с 7 654 показами и «купить подоконник для пластиковых окон» с 1 295 показами в месяц относятся к категории среднечастотников.
Эти виды частотностей хорошо подходят для неспешного продвижения сайтов и онлайн-магазинов в конкурентных нишах. Среднечастотные запросы охватывают более широкую аудиторию, чем низкочастотные. Однако это не массовый спрос, как в случае с высокочастотными ключами.
Высокочастотники – это запросы широкой направленности, которые содержат одно или два ключевых слова. Можно условно считать ключевик с показами от 1500 раз в месяц высокочастотным. Но это все условно, не забывайте.
Например, запрос «Самсунг» показывается почти 10 миллионов раз. Этот высокочастотный запрос, некая сборная солянка, которая включает в себя все возможные варианты фраз со словом «Самсунг».
Основное применение высокочастотников – имиджевая реклама, формирование положительного мнения о бренде, продуктах и услугах. Такие запросы подходят для кропотливой и дорогой работы на несколько лет. Важно учитывать, что в огромном потоке трафика большая доля нецелевой аудитории. К чему это может привести? К росту отказов, снижению ранга сайта, жесткой конкуренции, значительным тратам бюджета и прочим радостям SEO продвижения по высокочастотным ключам.
Виды частотностей в Яндексе
Что такое частотность в общем понимании мы разобрались. Рассмотрим теперь, как разделяет запросы по категориям Яндекс Вордстат. Сервис выделяет три частоты:
Базовая частота – это количество показов по всем возможным вариантам использования ключевого слова. Именно поэтому она является самой неточной, общей. Например, в запрос «купить смартфон» попадут все фразы, которые содержат эти два слова – «купить смартфон Samsung», «купить смартфон дешево», «купить смартфон в Туле недорого» и многие другие. С базовой частотой работают, когда нужно узнать общую заинтересованность тематикой у ЦА. Чтобы проверить базовую частотность в сервисе Яндекс Вордстат нужно ввести запрос как есть, то есть без спецсимволов (операторов).
2. Фразовая частота и оператор «» – показывает количество ввода конкретного запроса в разных склонениях. Например, тот же запрос «купить смартфон» возьмём в кавычки, чтобы определить фразовую частоту. Видим, что именно так фразу набирали 18 670 раз в месяц при базовой частоте 519 980. Количество показов резко уменьшилось, потому что в точной частотности не учитываются добавочные слова, вроде «купить», «заказать», «обзор» и другие.
3. Точная частотность и оператор (!) – показывает, сколько раз пользователи вводили запрос в конкретном виде с учетом склонения, числа, спряжения. Чтобы максимально узнать частоту нужно запрос взять в кавычки и перед каждым словом поставить восклицательный знак. Например, возьмем запрос «смартфон samsung galaxy» и рассчитаем уточненную частотность по нему. Мы видим, что именно так запрос набирали 480 раз в месяц при базовой частоте 88 056. Получается, что из высокочастотного ключевика запрос превратился в средне- или даже низкочастотный.
Какие запросы лучше для SEO продвижения?
Частотность – это показатель популярности поискового запроса у целевой аудитории. Если вы продвигаете коммерческий проект, то лучше использовать низко- и среднечастотные фразы, как наиболее предметные. По ним вы получите максимально целевой трафик.
Алгоритм примерно следующий:
Сайт не оптимизировался (стартап проект) – используйте сначала низкочастотные запросы. После 2-3 месяцев подключайте трафик по среднечастотникам и популярным ключевикам в нише;
Сайт уже оптимизирован под НЧ и СЧ – можно брать в работу высокочастотники.
В любом случае, если нужно больше целевых пользователей, используйте НЧ и ВЧ запросы. Если вы развиваете спрос, поднимаете имидж компании – это ВЧ запросы. Хотите максимальной конверсии страницы, делайте упор только на НЧ.
Сервисы для определения частотностей запросов
Самым популярным сервисом для определения статистики по запросам считается Яндекс Wordstat. Этот инструмент бесплатен и довольно прост в использовании. Чтобы посмотреть статистику по ключевикам войдите в сервис и в поисковой строке наберите нужный запрос, после чего нажмите кнопку «подобрать».
Можно отфильтровать сбор по городам, странам и областям, выбрав в выпадающем списке нужный регион.
Также вы можете узнать статистику по устройствам: десктопы, мобильные, только телефоны и только планшеты.
В открывшемся окне планировщика нужно выбрать «получение статистики запросов и трендов», а в полях ввести искомые фразы вручную или загрузить списком. Также можно выставить таргетинг и отминусовать нецелевые фразы (минус-слова).
Выставив настройки, жмите «узнать количество запросов». Откроется окно с данными по частотности, уровню конкуренции и рекомендованной ставке в рекламе.
Также есть несколько интересных онлайн-платформ для анализа ключевых слов. Например, Serpstat – сервис помогает анализировать поисковые фразы в нише, а также собирать ключевики конкурентов. Зачастую удобнее и быстрее собрать семантику на сайтах из ТОП-10, чем перебирать десятки тысяч ключевиков в Вордстате.
Лидер программного сбора и анализа ключевиков – это Key Collector. Программа должна быть у каждого SEO-оптимизатора по умолчанию. Софт парсит (собирает) данные с левой колонки выдачи Яндекс Вордстата, а также с сервиса Яндекс.Директ. Кроме того, собирает данные с Google Ads, поисковых подсказок и некоторых платных сервисов. Key Collector – сложный инструмент, но он позволяет максимально автоматизировать сбор и обработку огромного количества ключевиков.
Мы узнали, что такое частотность запросов. Научились различать ключевики по видам – низкочастотные, среднечастотные и высокочастотные. Познакомились с операторами частотности в Яндекс.Вордстат, а также рассмотрели популярные сервисы и программы для работы с ключевыми запросами.
Продвижение по НЧ и ВЧ запросам
Четкой границы между низкой, средней и высокой частотой нет, она индивидуальна для каждой тематики.
Это ключевые фразы, которые достаточно редко набирают в поисковых системах.
Продвижение по НЧ запросам — самый простой и легкий способ повысить посещаемость сайта. Продвинуть низкочастотные фразы в ТОП довольно просто. Вам лишь необходимо составить список таких запросов и оптимизировать посадочные страницы под них: прописать мета-теги, разместить уникальный текст, и если это интернет-магазин, то добавить выборку соответствующих товаров.
Продвижение сайта по низкочастотным словам обладает рядом преимуществ:
Обычно выделяют две категории сайтов:
Это запросы, которые обладают высокой частотой спроса в интернете.
Попадание сайта по ВЧ запросу в ТОП выдачи сильно отражается на росте посещаемости и его видимости. Но у высокочастотных запросов может быть размытый интент, и поэтому тип запроса может меняться в течение времени. Здесь продвижение по НЧ выглядит лучше: на сайт переходят целевые посетители.
Если вы планируете продвижение по ВЧ, сначала отберите те запросы, которые явно относятся к коммерческому типу. Это необходимо для избежания привлечения нецелевого трафика.
Далее составьте план работ по оптимизации сайта, проведите подробные аудиты ваших конкурентов, составьте список технических доработок сайта и приступайте к работе.
Если вы решили продвинуть сайт по ВЧ запросам, то необходимо запастись терпением, поскольку продвижение по ВЧ противоположно продвижению по НЧ. Это означает:
Следует запомнить, что выйти в ТОП по высокочастотному запросу крайне тяжело без оптимизации сайта под низкочастотные фразы.
Ждите новые заметки в блоге или ищите на нашем сайте.
Для чего нужны частотные словари и почему одни слова важнее других?
Компьютеры стали активно использоваться в лингвистике только в последней четверти XX века. До того ученые, которые изучали язык, по большей части занимались описанием грамматических правил и значений слов, не опираясь на количественные данные. Но когда появилась возможность обрабатывать большие массивы текстов, стало ясно, что мы многое теряем, если не различаем частотные и редкие явления. О том, какую пользу могут принести исследования частотности в языке, специально для «Ножа» рассказывает Александр Пиперски — доцент РГГУ, научный сотрудник НИУ ВШЭ, лауреат премии «Просветитель»–2017.
Заглонитель и турмы
Попробуйте прочитать такой текст на русском языке:
Заглонитель Ланс Оливер чуть не погиб в результате наплочения турма. Он ехал ласкунно на лошади покровнательно от Мэнсфилда (Австралия) и увидел вахню турмов, в которой было кастожно 15 животных. Столенно, ничего бы и не случилось, если бы собака Оливера не начала порочить на вахню.
Один из турмов — старый, крупный лователь, выбатушенный корочением собаки, бросился за ней. Та отпешила скумановаться за лошадью, на которой сидел Оливер. Тогда турм бросился уже на Оливера. Он схватил подвешенца отмаленными твинами за плечи и вытокнул его на землю.
Цитируется по: Р. М. Фрумкина. Психолингвистика. М., 2001
Вы встретили множество незнакомых слов, но нет сомнений, что вы в целом поняли, о чем здесь говорится, и даже можете пересказать содержание. А сконструирован этот текст очень простым способом: взят нормальный текст, но сохранены в нем только самые частотные слова, а все редкие заменены вымышленными. Вот оригинал этой истории:
Скотовод Ланс Оливер чуть не погиб в результате нападения кенгуру. Он ехал верхом на лошади неподалеку от Мэнсфилда (Австралия) и увидел стадо кенгуру, в котором было примерно 15 животных. Возможно, ничего бы и не случилось, если бы собака Оливера не начала лаять на стадо.
Один из кенгуру — старый крупный самец, раздраженный лаем собаки, бросился за ней. Та попыталась укрыться за лошадью, на которой сидел Оливер. Тогда кенгуру бросился уже на Оливера. Он схватил всадника передними лапами за плечи и сбросил его на землю.
Получается, для того, чтобы понимать человеческий язык, достаточно неполных знаний. Более того, полных знаний и не бывает: никто из нас не может знать все слова и гарантировать, что поймет от начала и до конца любое встретившееся ему предложение.
«и», «в», «не», «на»: частотный словарь
Представьте себе, что вы изучаете русский язык и хотите узнать: сколько слов надо выучить, чтобы понимать 20 % текста на этом языке? Ну или не понимать, а хотя бы опознавать 20 % слов в тексте.
Очевидно, что полезно сперва учить частотные слова, а потом уже редкие: знать слово «собака» куда важнее, чем «самец» или «всадник», и уж тем более, чем «вольвокс» или «рейсфедер».
Самый популярный частотный словарь для русского языка в 2009 году создали Ольга Ляшевская и Сергей Шаров. Он свободно доступен на сайте Института русского языка им. В. В. Виноградова. Первое по частотности русское слово — это слово «и», за ним следуют «в», «не», «на», «я» и т. д. — вот и будем запоминать их подряд по этому списку:
Вернемся к предложению, в котором мы поставили перед собой задачу:
Представьте себе, что вы изучаете русский язык и хотите узнать: сколько слов надо выучить, чтобы понимать 20 % текста на этом языке?
В нем 20 слов, а значит, 20 % от них — это 4 слова. А теперь присмотритесь внимательно: оказывается, выучив первые 14 слов из частотного словаря, мы и узнаем в этом тексте 4 слова — «что», «и», «на» и «этом». Желанный результат достигнут: 20 % текста поняты (хотя до смысла, конечно, еще очень далеко).
В частотном словаре каждому слову приписано число, которое показывает, сколько раз это слово встретится, если мы возьмем текст длиной 1 миллион слов. Слово «и» мы в таком тексте увидим примерно 35 802 раза, слово «в» — 31 374 раза и т. д. Если сложить частоты первых 14 слов, то окажется, что они покроют 188 072 слова из миллиона — то есть почти те самые 20 %, к которым мы стремились. Чтобы выйти за 200 000, к ним надо добавить еще три слова («к», «но» и «они»). А чтобы понять 10 % текста, достаточно и вовсе 4 слов.
Вот полные списки слов, которых хватит, чтобы понять 10 %, 20 %, 30 % и 40 % текста на русском языке:
Видно, что на первые 10 % у иностранца уйдет совсем мало усилий. На следующие 10 % понадобится еще 13 слов; чтобы достигнуть 30-процентного понимания, придется добавить 29 слов, а чтобы добраться до 40 % — 86 слов. Чем дальше мы идем по частотному списку, тем менее полезно нам каждое следующее слово:
Иначе говоря, в любом языке есть совсем немного высокочастотных слов и много низкочастотных. Например, 1 раз на миллион слов, согласно словарю Ляшевской и Шарова, встретится 1478 слов; среди них — «резвость», «увильнуть», «боезапас», «сызнова», «картографирование». Ясно, что это совсем не то, что надо учить в первую очередь.
Слова, города и всё на свете: закон Ципфа
Частоты слов подчиняются простой математической закономерности, которую в середине XX века открыл американец Джордж Кингсли Ципф (1902–1950).
Источник
Он сформулировал такую зависимость, которая получила название «закон Ципфа»: частотность слова обратно пропорциональна номеру слова в частотном списке. Например, если первое слово имеет частотность 60 000, то у второго слова будет частотность 60 000 / 2 = 30 000, у третьего — 60 000 / 3 = 20 000 и т. д. В реальном языке всё не получается так красиво: например, русский частотный словарь укладывался бы в закон Ципфа гораздо лучше, если бы у слова «и» частотность была не 35 802, а как раз около 60 000, тем не менее даже это приближение неплохо работает. Если изобразить распределение частот для первых 200 русских слов на графике, видно, что оно имеет форму гиперболы.
Закон Ципфа — один из редких примеров закона, который был открыт на материале языка, а потом нашел применение во множестве других областей.
Ему подчиняются размеры населенных пунктов, количество ссылок на сайты, размеры компаний: в стране обычно есть совсем немного крупных городов и много-много мелких населенных пунктов; есть небольшое количество очень важных сайтов, на которые все ссылаются, и много сайтов, на которые не ссылается никто или почти никто; бывают гигантские компании, но мелких гораздо больше.
Например, в Берлине 3,5 млн жителей; во втором по величине городе Германии — Гамбурге — примерно в два раза меньше: 1,8 млн. В шестом городе страны — Штутгарте — примерно в шесть раз меньше: 600 тысяч, и т. д. Видно, что на этих данных закон Ципфа работает превосходно.
Когда пытаются понять, написан ли какой-то текст на человеческом языке или нет, одна из первых проверок, которые стоит сделать, — посмотреть, подчиняется ли текст закону Ципфа.
Например, в загадочном манускрипте Войнича закон Ципфа соблюден довольно неплохо. Правда, это только необходимое условие, но еще не доказательство того, что перед нами естественный язык: именно потому, что закон Ципфа применим почти к чему угодно, в том числе и к неязыковым данным.
Зачем нужны частоты
Частотный словарь может быть полезен на практике для изучающих иностранный язык: конечно, не стоит заставлять человека, когда он узнает новое слово, выяснять точно, какое именно место в частотном списке оно занимает, но можно дать ему представление о том, стоит ли вообще это слово запоминать. Например, в словарях издательства Macmillan есть два типа слов: красные и чёрные, причём у красных слов стоят еще звездочки — одна, две или три. Вот несколько примеров:
Красные слова с тремя звездочками занимают в частотном словаре места с 1-го по 2500-е, слова с двумя звездочками — с 2501-го по 5000-е, а слова с одной звездочкой — с 5001-го по 7500-е. Черные слова располагаются ниже 7500-го места. Для пользователя это имеет очень простые следствия. Если ты ищешь в словаре слово и видишь при нем три звездочки, выучи его обязательно: оно наверняка попадется еще много раз. Если при слове только одна звездочка, это достаточно полезное слово, но часто не пригодится. И, наконец, черные слова — совсем редкие; их стоит заучивать, только если стремишься выучить язык на продвинутом уровне, но если не получится, то ничего страшного. Можно прекрасно говорить по-английски, не зная, что thatch значит «соломенная крыша», а crescent — «полумесяц»; без слов restriction «ограничение» и allegedly «якобы» тоже можно прожить, а вот слова animal «животное» и play «играть» точно надо знать.
Еще одна важная область, в которой применяется частотный анализ, — это автоматическая обработка текста (natural language processing). Например, для проверки орфографии и исправления опечаток очень важно понимать, какие слова редкие, а какие — частотные. Предположим, что пользователь напечатал такую английскую фразу:
I am looking at teh black dog.
Мы прекрасно понимаем, что в ней содержится опечатка: вместо teh должно быть написано the. Но ведь teh могло легко получиться и из чего-нибудь другого: что если пользователь хотел ввести ten, но случайно попал в букву h вместо n? Или, может быть, он хотел напечатать tech, но пропустил букву c? Почему же мы всё-таки полагаем, что имелось в виду слово the, в котором переставились две буквы? Можно, конечно, долго рассуждать о том, что с ten и с tech получится неправильное предложение (например, ten black dog — плохое сочетание слов, а должно быть ten black dogs), но это знание трудно формализовать и вложить в компьютер. Но можно поступить проще: заглянем в частотный словарь, и он сообщит нам, что the — самое популярное английское слово, так что вероятность того, что пользователь хотел напечатать именно его, особенно велика. Эта стратегия — всегда исправляй опечатку на самое частотное из похожих слов — может показаться примитивной, но она неплохо работает.
В 2007 году директор по исследованиям компании Google Питер Норвиг за несколько часов, проведе–нных в самолете (даже без интернета!), написал программу для исправления опечаток, которая занимает всего 22 строки кода на языке Python и в первую очередь опирается на частотность.
Всё это свидетельствует об одном: человеческий язык не описывается только грамматическими правилами. Важно знать, как часто встречаются в нем те или иные слова. К счастью, такие знания благодаря компьютерам можно очень легко получить, и это открывает для лингвистики новые перспективы.