<?xml version="1.0" encoding="windows-1251"?>
<rss version="2.0">
   <channel>
      <title>Блог Владимира Торопчина</title>
      <link>http://toropchin.com/</link>
      <description>Vladimir Toropchin blog</description>
      <language>ru</language>
      <copyright>Vladimir Toropchin</copyright>
      <managingEditor>toropchin_vv@mail.ru</managingEditor>
      <webMaster>toropchin_vv@mail.ru</webMaster>
      <image>
         <title>Блог Владимира Торопчина</title>
         <url>http://toropchin.com/i/lastoblog.png</url>
         <link>http://toropchin.com/</link>
      </image>

      <item>
         <title>В поисках уникального контента</title>
         <link>http://toropchin.com/post_1224778063.html</link>
         <description>&lt;p&gt;&lt;img src="http://toropchin.com/i/p/1224778063.jpg" align="left" width="204" height="147" hspace="5" vspace="5" alt="В поисках уникального контента"&gt;
Тема поста опять о том, где брать уникальный контент.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;В этом блоге про данную затейливость написано две заметки. Сейчас я Вам расскажу про секретную технологию нахождения уникального контента в интернете.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Задумывался ли кто-нибудь из вас о том, что в интернете существуют блоги с очень качественным уникальным контентом, но по каким-то причинам не проиндексированы яндексом. Я говорю с уверенностью, что таковые есть.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Теперь о том, как их искать. Нам понадобится программа для поиска блогов. Называется она Fast Blog Finder. Программа платная, и просят за неё всего 25 долларов. Могу сказать, что этих денег она стоит. Назначение у программы немного другое. Она ищет пиаристые блоги на движке WordPress с плагином DoFollow. Но мы будем использовать её не по назначению. Нам от неё нужна только возможность найти блоги и выдать списочек в виде текстового файла.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Жмём кнопочку импорта и сохраняем списочек в текстовый файл. Далее берём полученный списочек ссылок и проверяем их на проиндексированность яндексом. Делается это программой &lt;a href="http://toropchin.com/yandexoid.html" target="_blank"&gt;Yandexoid&lt;/a&gt;. После проверки возникнет картина, что из всего списка в индексе яндекса отсутствует около четверти страничек из списка.&lt;/p&gt;

&lt;br&gt;



&lt;p&gt;Но это ещё не конец. Работа только начинается. Теперь надо найти из этого списка тот самый уникальный контент. Делается это ручками и головой, ибо тут нужен интеллект. Работа похожа на поиски иголки в стоге сена. А с учётом того, что ищем-то мы русскоязычный контент, то не в стоге сена, а в огромной куче не очень приятно пахнущего навоза.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Способ первый.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Тупо открываем все странички с полученного списка. С первого взгляда определяем, что за сайт высветился в окне браузера и если он похож на то, что сделано для людей, проверяем его на уникальность контента. Сделать это очень просто. Надо всего лишь забить в яндекс строчку текста с контента этого сайта. И если документов в индексе с точно таким текстом нет, то считается, что контент уникальный. Дальше проверяем, сколько страничек сайта вообще проиндексировано. Как это сделать знает каждый вебмастер. Если сайт не проиндексирован и у него нормальный человекопонятный контент, то смело берём его себе.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Второй способ.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Глазками просматриваем список ссылок. И выкидываем все бессмысленные url. Обычно то, что нужно выбросить, даже прочитать с первого раза не удаётся. Дальше, как и в первом способе проверяем остаток ручками и человеческим интеллектом.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Способ третий.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Этот способ самый продвинутый. В ходе отбора было замечено, что блоги не просто так вылетают из яндекса. Они должны были это заслужить. Вылетали они в основном за дублирование контента. Дубликаты нам не интересны. А вот те, которые нам нужны, вылетали из-за заспамливания тупыми комментариями. Как известно яндекс за то, что сайт не модерируется сажает его попкою на кол. Тут надо вернуться к программе Fast Blog Finder. В результатах поиска можно узреть какое количество исходящих ссылок имеет страничка блога. Предполагается, что блог был зиспамлен, а это значит, что в комментариях должно содержаться огромное количество исходящих ссылок. Начать правильно будет с тех сайтов, в которых этого спама больше всех.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Нам понадобится импортировать два списка из программы для поиска блогов. Первый список для того, чтобы проверить его на проиндексированность яндексом, второй список такой же, но с маленьким дополнением. Нужен ещё столбец с количеством внешних ссылок. Разделителем между урлом и количеством исходящих должен быть TAB.&lt;/p&gt;&lt;br&gt;



&lt;p&gt;Проверяем первый список на проиндексированность. Загоняем вот в &lt;a href="http://toropchin.com/i/other/programma.exe" target="_blank"&gt;эту программку&lt;/a&gt; второй список и список, который получился на выходе яндексоида и именуется первым. Жмём кнопочку GO. Получаем списочек со страничками, которых нет в яндексе, и напротив каждого url имеется число исходящих ссылок. Сохраняем списочек с удобным для нас расширением - txt или excel. Дальше всё как в первом или втором пункте - проверяем те странички, на которых больше всех исходящих ссылок. Остальные можно смело пропустить, ибо они нам не подходят.&lt;/p&gt;

&lt;br&gt;



&lt;p&gt;С нетерпением жду Ваших комментариев.&lt;/p&gt;

&lt;br&gt;

&lt;div style="float:right;margin-right:25px;color:#797;"&gt;Tue, 02 Dec 2008 11:57:42 GMT&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin-left:10px;color:#575;font-weight:bold;"&gt;В поисках уник. контента&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:#333;"&gt;А альтернатива Fast Blog Finder есть?&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:green;"&gt;&lt;a href="http://toropchin.com/connect_e76e43bac51e2498d944f4488d94906bfe9a56f.html"&gt;WebFox&lt;/a&gt;&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;



&lt;br&gt;

&lt;div style="float:right;margin-right:25px;color:#797;"&gt;Tue, 02 Dec 2008 12:23:39 GMT&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin-left:10px;color:#575;font-weight:bold;"&gt;&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:#333;"&gt;Есть такие... После долгих поисков в гугле обязательно найдёте, но попробовав Fast Blog Finder ничего другого больше не хочется.Ищем несуществующую иголку.&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:green;"&gt;&lt;a href="http://toropchin.com/"&gt;&lt;/a&gt;&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;



&lt;br&gt;

&lt;div style="float:right;margin-right:25px;color:#797;"&gt;Wed, 07 Jan 2009 00:15:32 GMT&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin-left:10px;color:#575;font-weight:bold;"&gt;Ищем несуществующую иголку&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:#333;"&gt;Блоги с качественным уникальным контентом и не проиндексированы Яндексом? Такие бывают?&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:green;"&gt;&lt;a href="http://toropchin.com/connect_abdbd46bf06dad16bfb36348ad16bf8f91cf6bf1cf549face24abdb36bd43488288f9e24.html"&gt;seoded&lt;/a&gt;&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;



&lt;br&gt;

&lt;div style="float:right;margin-right:25px;color:#797;"&gt;Sun, 20 Sep 2009 00:51:59 GMT&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin-left:10px;color:#575;font-weight:bold;"&gt;Такие бывают?&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:#333;"&gt;Мне тоже кажется. что блоги с качественным контентом со свистом залитают в Яндек, после чего контент становится явно не уникальный. &lt;br&gt; &lt;br&gt; Сужу по своим блогам. После того, как опубликую статью (блог не ГС) через пару часов она уже в поиске. Естественно что Яша кушает RSS ленту.&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;

&lt;div style="margin:10px;color:green;"&gt;&lt;a href="http://toropchin.com/connect_8b55c18b5b91b0f943f6b1dfd2b5c1deab0f4711a9b916eb.html"&gt;Анатолий Солдатов&lt;/a&gt;&lt;/div&gt;

&lt;div style="clear:both;"&gt;&lt;/div&gt;



&lt;br&gt;

&lt;div style="margin-left:10px;color:#575;font-weight:bold;"&gt;&lt;a href="http://toropchin.com/comment_1224778063.html"&gt;Оставить комментарий&lt;/a&gt;&lt;/div&gt;

         </description>
         <pubDate>Thu, 23 Oct 2008 12:07:43 GMT</pubDate>
      </item>
   </channel>
</rss>