Авторизация Регистрация

Здесь пока все ясно :)

Хелп лист будет формироваться из ваших вопросов.

 

Интервью с разработчиком сининомайзера

В продолжении темы о синонимах я заинтересовался сервисами, помогающими оптимизаторам и копирайтерам в написании хороших текстов. Одним из таких сервисов является blogka. Разработчик скрипта согласился ответить на несколько вопросов, за что ему отдельное спасибо.

1. Здравствуйте, Игорь. Расскажите немого о своем ресурсе.

Скрипт создан для выборочной синонимизации русскоязычных текстов, проще говоря для уникализации текстов для поисковиков. Написан на PHP. Использует базу данных MySql.

Работает по принципу разрушения шингла*, основной меры определения уникальности текстов поисковиками. Надо сказать, что не все русскоязычные поисковики используют алгоритм определения похожести текстов на основе шинглов, но данный метод замены слов синонимами в размере шингла позволяет обойти и другие алгоритмы. Можно сказать, что алгоритм разрушения шинглов путем нахождения синонимов достаточно универсален, надежен и малозатратен.

Скрипт поддерживает морфологию русского языка и производит все словоформы всех частей речи за исключением глаголов. Морфологический анализ производится на основе таблиц AFFIX, что позволят расширить таким образом словарь примерно в пять раз. В словаре синонимайзера примерно 300 000 слов и 1 200 000 синонимов и соответственно получается порядка 5 000 000 словоформ.

Для лучшей читабельности текстов, перед синомизацией текста проводится определение его тематики методом весовых коэффициентов ключевых и значимых слов на основе словаря размером примерно 100 000 слов составленного по тематикам Рамблера TOP100, и в процессе синонимизации скрипт старается подбирать словоформы синонимов соответствующие тематике текста.

Тематики включают в себя включают в себя : Авто И Мото , Администрации , Аналитика , Банки , Безопасность , Бизнес И Финансы , Города И Районы , Дети , Дизайн , Железо , Дамский Клуб , Законы , Знакомство И Общение , Игры , Искусство , История , Кино , Классификаторы , Компании , Компьютеры , Беллетристика , Медицина , Мр3 , Музыка , Наука , Недвижимость , Непознанное , Образование , Отдых , Погода , Политика , Природа, Провайдеры , Платформы , Продукты Кормления , Промышленность , Прочее , Путешествия , Работа , Радио , Удовольствия, Раскрутка , Религия , Связь , Сервисы , Сми И Периодика, Спорт , Страхование , Строительство , Телевидение , Техника , Технологии , Товары И Услуги , Транспорт , Увлечения И Хобби , Фото , Электроника , Юмор.

Обычно количества замененных синонимов в тексте не превышает 20-30% что с перекрытием хватает для обхода фильтров похожего контента поисковиков, но для уверенности можно добавить несколько дополнительных алгоритмов повышающих коэффициент уникальности, такие как: закрытие некоторых слов Яваскриптом, добавление опечаток, разбиение значащих слов переносами, всевозможное разрушение не только шингла но и сигнатур в предложениях, и самих предложений, причем таким образом, что на читабельности текста это сказывается минимально.

Скрипт может использоваться в трех режимах: в автоматическом с подошью веб интерфейса, в полуавтоматическом, когда скрипт выдает синонимы в текст так что их можно выбрать из списка, и в режиме подпрограммы его можно встроить в любой Ваш скрипт на PHP.

В некоторых случаях когда текст мал и не содержит явных признаков тематичности лучше пользоваться полуавтоматом, с помощью Вашего мозга и полуавтоматического синонимайзера Вы если не решите свои темы с рерайтом, то намного упростите их.

Потестить скрипт серверного синонимайзера можно на сайте
Купить скрипт серверного синонимайзера можно здесь

2. Понимают ли поисковики синонимы или понимают как уникальный контент?

Все поисковики на данный момент понимают синонимы как уникальный контент.

3. Будет ли Ваш сервис осваивать новые языки?

Вероятнее всего – нет.

4. Насколько актуальным есть использование синонимов при работе с сервисами покупки ссылок или все же стоит использовать конкретные запросы пользователей?

Яндекс в Находке сделал достаточно широкий шаг в этом направлении, релевантность документов стала сильнее зависеть от анкор листа по наблюдения гуру с серченжина. И я думаю, что анкоры с точным вхождением, для него более ценны, чем их синонимы. Я также не поддерживаю теорию так называемой “склейки анкоров”. Исходя из вышесказанного, я думаю, использовать синонимы при работе с хитрыми конторами – лишний и бесполезный геморой

5. Чем отличается бесплатный и платные варианты скрипта?

Практически ничем, отсутствует ограничение в выдаче и нет капчи**.

6. Будет ли в дальнейшем расти роль текстового контента в сети или приоритеты перейдут на видео и аудио материал?

Практика показыват что количество мультимедийного материала в сети растет, и поисковики уже начинают достаточно хорошо искать и по такому типу контента. Но закат роли текстовой составлющей еще достаточно далеко, примерно также далеко как исчезновение клавиатуры у компьютера :)

* Шингл (shingle) – это специальное хеш-значение однородной последовательности слов или фраз текста зафиксированной длины.

** Капча, каптча (CAPTCHA, Completely Automatic Public Turing Test to Tell Computers and Humans Apart) — механизм, с помощью которого веб-сайт отличает людей от роботов (ботов, программ-роботов). Обычно пользователю предлагается ввести в поле формы число, изображенное на автоматически-сгенерированной картинке.

Вам также может быть интересным ↓

Добавить комментарий

Делать центр загрузки моделей?

View Results

Loading ... Loading ...