Ищу дроп-домены на yellowpages, нашел 390к

2019-03-11

Задача: найти дропы для PBN или 301 редиректов.

Как: Выгрузить акцепторов крупных сайтов и пробить их на доступность покупки.

Данный способ использую редко, так как занимает достаточно времени, а выхлоп ооочень маленкий. В пабликах вижу что многие говорят «парсте акцепторов и будет вам успех, деньги, слава, победы!» Но никто не пишет сколько времени и сил нужно вложить и какие ресурсы нужны.

Напишу наперед. В этом примере я явно не угадал с донором — yellowpages.com, так как выхлоп получился дно-днищее, но кто ж знал.

И так

1. Выгрузил домены, получил больше 400к строк.

картинка

2. На изи извлекаю домены с csv файла (спасибо python).

import pandas

data = pandas.read_csv('ahrefs.csv', sep='\t', low_memory=False)

domains = data['Linked Domains']

with open('result.txt', 'a', encoding='utf-8') as result_file:
	for domain in domains:
		result_file.write(str(domain)+'\n')

Теперь у меня есть 4187458 доменов с yellowpage

картинка

3. Пробиваю доступность доменов к покупке на Godaddy. Тут потратил дня 3 на пробивку. Благо есть VDS где можно запустить скрипт и не париться.

По итогам:

  • 3615127 — taken (занятые)
  • 417 — excluded (например: google.com, facebook.com)
  • 19205 — pusto (не пробились, godaddy не потдерживает такие зоны. Например: 12.ma.us, 145.aero, spi.org.za, .gov.za)
  • 100810 — premium (ценники $500, $8000 например, 101mediapro.com, 1022south.com)
  • 53876 — auction
  • 390500 — available_for_registration

Еще были мусорные, их убрал руками/регулярками: 埼玉の切手買取.com, ip-адреса

3.1. Оставил только available_for_registration. Тут нужно еще почистить от сайтов на поддоменах. Вот какие сайты с верхними доменами очистил и их количество:

  • amazonaws.com;32
  • wikispaces.com;8
  • fc2.com;2
  • webs.com;5189
  • hi5.com;3
  • wordpress.com;6288
  • squarespace.com;76
  • yahoo.com;2
  • blogger.com;2
  • piczo.com;12
  • edublogs.org;2
  • typepad.com;85
  • google.com;12
  • weebly.com;7948
  • hyves.nl;2
  • tumblr.com;268
  • sourceforge.net;8
  • posterous.com;12
  • livejournal.com;7
  • over-blog.com;2

4. Ну что ж, тепер самое интерестное — стата Majestic. Дальше у меня было по плану пробить ahrefs, spamzilla но бляя. шо тут говорить

Сортировка по refDomain картинка

Сортировка по TrustFlow картинка

отфильтровал TF>5 и RedDomains > 20 картинка

В результате почти все содержат спам пирзнаки по метрикам Spamzilla картинка

Пример ада — archwayschool.org картинка

Ссылка на domains.db с 369162 доменам доступных к регистрации на момент пробивки + стата по majestic https://drive.google.com/file/d/1Dgu_8x7STuMsXDwWmHGEUQOpF4bc9zWb/view?usp=sharing

Вобщем с переменным усердием весь процесс у меня занял дней 5 с учетом выходных. Не было цели упороться и сделать все максимально быстро. Я хотел токльо пробить список и написать об этом )

seopbn

Как спарсить People also ask в выдаче Google by Netpeak Spider

Поиск форумов из беклинков конкурентов

comments powered by Disqus