Zaawansowany audyt SEO - Zadbaj o kondycję swojej witryny

Interpretacja danych znajdujących się raporcie

2013-09-30 23:29:41

Raport składa się aktualnie z 3 zakładek:

  • linki
  • treść
  • słowa kluczowe

Linki

System ocenia każdą z linkujących podstron na podstawie szeregu czynników określających wskaźniki jakościowe dla strony linkującej. Na tej podstawie ustala rangę strony linkującej określanej jako: „Jakość”. Zatem głównym zadaniem systemu jest określenie które linki i z jakim prawdopodobieństwem są linkami słabej jakości. Z doświadczenia wynika, że zdarza się (i będzie się zdarzać), że niektóre strony, które są stronami słabej jakości – potocznie zwane spamem -  dostają wysoką punktację. Jest to naturalne – cały czas pojęcie spamu zmienia się , tak jak i pomysłowość pozycjonerów – zatem naszym zadaniem jest ciągłe ulepszanie algorytmu w celu coraz lepszego wyłapywania linków słabej jakości. Jednak ani Google ani my nie osiągniemy nigdy 100% skuteczności.

Z drugiej strony system charakteryzuje się niezwykle wysoką skutecznością w kierunku odwrotnym – czyli to, co określi jako spam w zasadzie bez większych wyjątków spamem jest. Z naszych obserwacji wynika, że w tym miejscu skuteczność systemu sięga 99%. Zatem system koncentruje się na określeniu co jest pewnym spamem, a nie odnalezieniem wszystkich możliwych stron, które emitują linki słabej jakości.
 
Aktualnie pracujemy nad dodatkowymi czynnikami wykrywającymi spam, a dodatkowo system posiada mechanizmy samouczące – im więcej danych jest przetworzonych przez system, tym precyzyjniej system ocenia co jest linkiem słabej jakości a co nie.

Nie chcemy opisywać dokładnie czynników i wag, które wchodzą w skład oceniania strony z kilku powodów:
  • wielu pozycjonerów zacznie tak modyfikować swoje strony, aby SC nie wykrywało ich witryn jako spam
  • punktacja powstała w wyniku przebadania wielu projektów i ustawiona w ten sposób, aby uzyskać jak największą skuteczność oceniania – zatem stanowi część Know How, którego nie chcemy ujawniać publicznie
  • system jest samouczący – zatem określenie wprost wielu czynników jest w dużej mierze niemożliwe
  • do algorytmu będziemy dokładać następne czynniki (w tym momencie pracujemy nad 2 dodatkowymi czynnikami) i mechanizm punktacji będzie zmieniany.
 
Oto jakie przedziały przyjęliśmy na użytek własny przy określaniu, który link jest spamem, a który nie:
  • strony w przedziale 0-75% - spam
  • strony w przedziale 76-85% – strony o przeciętnej jakości
  • strony powyżej 85% - strony o dobrej jakości
 
Z naszego doświadczenia wynika, że warto przejrzeć strony, które zawierają się w przedziale powyżej 75%. Oczywiście to nasze doświadczenie, każdy dosyć łatwo jest w stanie ustalić swoje kryteria analizując jakość linków od najlepszego do najgorszego, przeciętnie ustalenie granicy spamu nie powinno zająć więcej jak 5 minut. Nie zaznaczamy tych granic w systemie z kilku powodów:
  • z czasem granice mogą się przesuwać (zgodnie z wdrażaniem następnych filtrów antyspamowych)
  • wiele zależy od branży oraz otoczenia witryny (konkurencji) – w przypadku szczególnie zaspamowanych branż inaczej Google określa granicę powiadomień ręcznych i granicy spamu.
Zatem przytoczone dane należy traktować jako wskazówkę, a nie wyrocznię.

System przeprowadza analizę witryny pod kątem typu CMS. W przypadku wykrycia, że typ danego CMS jest skryptem wykorzystywanym głównie do SEO, jest to uwzględniane jako jeden z czynników przy wyliczaniu jakości. Jest to zaznaczone w systemie jako dodatkowe pole „typ skryptu”.  Zatem warto poza wskaźnikiem jakości przejrzeć witryny linkujące pod kątem skryptów SEO.
Dziś do skryptów SEO zaliczamy: różnego typu katalogi, kopie DMOZ, kopie wikipedia oraz skrypty do tworzenia presell pages. W tym ostatnim przypadku chodzi o dwa główne skrypty – mocnelinki oraz wordpress. CMS oparty o wordpress sam z siebie nie powoduje ujemnych punktów. W przypadku stwierdzenia, że jest to blog lub katalog, system dalej poszukuje, czy dana domena wyszczególniona jest w któreś z monitorowanych baz służących do masowego umieszczania linków SEO. W przypadku, gdy taka domena znajdzie się na liście – dana strona określana jest jako spam i dostaje dodatkowe ujemne punkty.


Na podstawie procentowego określenia ilości linków słabej jakości oraz procentowego określenia ilości linków ze skryptów SEO można określić profil witryny.
Z naszego doświadczenia wynika, że strony które posiadają ok. 30% linków słabej jakości i 20% wszystkich linków pochodzą ze skryptów SEO są narażone na powiadomienia ręczne od Google. Ta granica została wyznaczona na podstawie kilkuset domen przebadanych przez system.
Analizując dane możemy określić, czy dana witryna może spodziewać się powiadomienia ręcznego oraz jaka jest faktyczna moc linkowania oraz z jakich źródeł linki pochodzą.

Treść

Podczas badania linków przychodzących system sprawdza, która podstrona klienta jest linkowana przez stronę linkującą. Podstrona ta jest również pobierana do systemu i poddawana analizie.
Na podstawie fraz system poszukuje, czy linkująca fraza zawarta jest wprost w treści strony.
Jak przeprowadzana jest analiza fraz:
  • fraza linkująca dzielona jest na pod-frazy (np. onet.pl – portal informacyjny podzielony zostanie na dwie podfrazy: onet.pl i portal informacyjny)
  • W przypadku gdy podfraza jest linkiem url wityny linkwanej lub stanowi część nazwy domeny taka podfraza określana jest jako brandowa
  • w przypadku, gdy podfraza nie jest podfrazą brandową oraz występuje w treści strony określana jest jako podfraza exact match
  • w pozostałych przypadkach jest określana jako fraza inna
  • na koniec system scala wszystkie podfrazy razem, wyliczając, ile w całej frazie (w procentach) jest części brandowych, a ile exact match.
W ten sposób system ustala (po przetworzeniu całego projektu) zestaw fraz exact match i fraz brandowych. Podczas tworzenia raportu system wylicza dla każdej strony ile procentowo w treści strony znajduje się fraz exact match w stosunku do długości tekstu na stronie i na tej podstawie określa procentowo nasycenie frazami exact match i jest podstawą do określenia, czy dana strona podlega pod algorytm o nazwie Panda. Z naszego doświadczenia wynika, że strony o nasyceniu większym jak 10% mogą zostać ukarane algorytmem o nazwie Panda.

Poza badaniem nasycenia podstron słowami kluczowymi system poszukuje w całej bazie innych stron, które posiadają podobną treść i je pokazuje jako strony o powielonej treści (duplicate content).
Im więcej stron zostało przetworzonych przez system, tym większe prawdopodobieństwo wyłapania dubli.
Poza badaniem zewnętrznych dubli, system poszukuje również dubli wewnątrz witryny. Trzeba przy tym zauważyć, że system nie ściąga całej witryny, a tylko podstrony podlinkowane i tylko takie brane są pod uwagę przy analizie tekstów.

Analizując dane możemy określić, która podstrona serwisu ma zbyt mało treści, która ma treść powieloną, a która mogła zostać ukarana algorytmem Panda.

Słowa kluczowe

Na podstawie określania, które linkujące frazy są frazami exact match i brand, system określa procentowy udział fraz exact match i brand we wszystkich znalezionych linkach.
Z doświadczenia wynika że:
  • jeżeli dla danej podstrony ilość wszystkich kierujących linków do tej podstrony z daną frazą exact match jest większa jak ilość linków brandowych, to taka fraza może zostać ukarana algorytmem o nazwie Pingwin.
Dzięki temu system potrafi bardzo precyzyjnie odpowiedzieć na pytanie, dlaczego tylko niektóre frazy kierowane na daną podstronę spadły w wynikach wyszukiwania.
Przykład:
  • fraza: „opony” – exact mach na poziomie 45%
  • fraza „wymiana opon” - exact match na poziomie 10%
  • branding na poziomie 40%
Potocznie przyjmuje się, że witryna, która ma ponad 40% fraz brandowych jest zabezpieczona przed algorytmem o nazwie Pingwin.
W przytoczonym przykładzie mimo że branding wynosi 40% może okazać się, że fraza „opony” ucierpiała w wyniku działania algorytmu Pingwin, zaś fraza „wymiana opon” już nie. Przeprowadzaliśmy analizę wielu witryn i okazuje się, że dopiero w przypadku, gdy ilość linków brandowych przekracza ilość linków exact match (na daną frazę), dana fraza jest bezpieczna. Oznacza to, że możemy mieć branding na poziomie 20% i nic złego z witryną się nie dzieje – pod warunkiem, że żadna z fraz exact match nie stanowi więcej jak 20% wszystkich linków.
Analizując dane jesteśmy w stanie stwierdzić, w którym momencie witryna może otrzymać karę w wyniku algorytmu Pingwin i na którym polu musimy szybko zadziałać.

Uwagi końcowe

System określa poszczególne parametry nie tylko dla całej witryny ale i dla poszczególnych podstron – zatem warto przeanalizować każdą podstronę serwisu pod wszystkimi trzema aspektami – linki – treść - frazy i poszukać jej słabych punków.



W przypadku, gdy system sam znajdzie problem – problemy te zgłaszane są w postaci Tipów i prezentowane pod wynikami zbiorczymi.




Każda z zakładek składa się z części syntetycznej – dzięki czemu można szybko zorientować się w najważniejszych parametrach oraz części analitycznej – gdzie każdy link czy podstrona prezentowane są oddzielnie i dane te można ściągnąć w postaci pliku CSV.




Korzystanie z witryny oznacza zgodę na wykorzystywanie plików cookies, które mogą być już zapisane w folderze przeglądarki na dysku użytkownika. Więcej informacji można znaleźć w Polityce prywatności i zaufania.

Akceptuję wykorzystanie plików cookie