Semalt Review - Få en tilpasset skraber til analyse af links

Som søgemaskineoptimeringsekspert kommer mange spørgsmål til mig, men jeg har ikke enkle løsninger til at tackle dem. De fleste af disse handler om profilering af URL-adresselister baseret på de oplysninger, der findes på sidens indhold. Derfor besluttede jeg at bruge Google Custom Search Engine, skønt den ikke leverede en komplet løsning. Nogle af de løsninger, som jeg gerne vil automatisere, inkluderer fuldt ud:

  • Link netværk nedbrud
  • Kommer med et frø sæt nøgleord, der bruges til nøgleord forskning
  • Evaluering af relevansen af URL-linking
  • Henter linkkilder fra specifikke CMS-systemer
  • Minedrift til webbloggere, der er specialiseret i en bestemt niche
  • Indbygget sporing af indhold

Rejsen startede med at udvikle en grundlæggende skraber til brug som et bevis på koncept til mere kompliceret linkanalyse. Brug af caveats, som er mere et værktøj til koncept snarere end et poleret værktøj, kræver tekniske og programmeringsfærdigheder til fuld fordel. Dets skalerbarhedseffektivitet kan udvides af enhver programmeringsekspert.

Som linkbuilder ville det være nødvendigt at komme med en grundig liste over bloggere i en niche, der forbinder til mine modstandere. Disse inkluderer blogs, som jeg kan målrette mod gæsteblogging, kommentering, pitching af indhold og sociale medier netværk. Brug af et værktøj som Open Site Explorer giver dig output til linking af domæner, men leverer ikke specifikke data om domænerens indhold.

Det første trin er at identificere et websted ved hjælp af et robust script. Det starter med generatoroutputet, som oprettes af adskillige CM'er. Andre kontroller er indarbejdet, mens de bygges ud.

Værktøjet behandler en liste med links og bestemmer dets CMS, udsender de rå data i en CSV, mens OSE-dataene opretholdes. Værktøjet kører gennem alle URL'er, cache indholdet og analyserer kildekoden

Find blogs

Den indledende opsætning gør det lettere at finde blogs, der linker til distilled.co.uk. Det er et vigtigt punkt at opdage nye blogs. Det er muligt at samle output fra forskellige modstandere og krydskontrol af alle de linkende domæner for at få links til din hovedniche.

Ekstra anvendelser til CMS

Der findes andre fodspor til at identificere et CMS, såsom login-destinationssider, temaer og admin-mapper. Et godt robust system kan udvikles til at hjælpe med at identificere CMS, der kører et websted. Det er nyttigt af følgende grunde.

  • Finde fora
  • Finde social CMS
  • Finde wiki-websteder
  • Få et link til do-follow
  • Link dråber

Du kan også kontrollere vedtagelsen af embeds, webstedwidgets og andre infografik. Dette spores bedre ved at opsætte advarsler, avancerede søgninger og gafler fysisk i et profillink.

Kontroller for linkets relevans - backlink- output giver grundlæggende oplysninger såsom URL og titlen. Det har ingen anden betydning.

Andre opgaver, den kan udføre, inkluderer følgende:

  • Find kataloglink
  • Minedrift til sociale konti som Facebook og Twitter
  • Minedrift af e-mail-adresser
  • Tjekker efter Adsense-websteder, der tjener penge
  • Evaluering af linkkvaliteter og spam- mers