missing link - Digitalstrategie & SEO aus Hamburg  »  Digital Insights  »  Yandex Code-Leak: So funktioniert die Suchmaschine
Yandex Code-Leak

Einblicke in die Ranking-Faktoren von Yandex

Was der Yandex Code-Leak über die Arbeitsweise moderner Suchmaschinen verrät

Karsten Buth, 31. Januar 2023

Yandex und Google sind Wettbewerber im Suchmaschinenmarkt und bieten ähnliche Leistungen an. dazu gehören beispielsweise Karten- und Routingfunktionen, Webanalyse-Dienste, Übersetzungshilfen und natürlich umfassende Suchmaschinen. Beide Unternehmen nutzen komplexe Algorithmen, um die Relevanz von Websites für bestimmte Suchanfragen zu bewerten und deren Ranking zu bestimmen. Wie genau dabei vorgegangen wird, ist eigentlich das Betriebsgeheimnis der Anbieter. Bisher, denn seit einigen Tagen wissen wir zumindest, wie Yandex dabei vorgeht.

Inhalt dieses Beitrags

1. Wie ist bekannt geworden, wie die Suchmaschine Yandex arbeitet?

2. Welche Ranking-Faktoren sind für Yandex wichtig?

3. Lassen sich die Erkenntnisse aus dem Yandex Code-Leak auf Google übertragen?

4. Das Wichtigste in Kürze

Wie ist bekannt geworden, wie die Suchmaschine Yandex arbeitet?

Yandex ist die wichtigste Suchmaschine in Russland und hat – ähnlich wie die amerikanische Konkurrenz – über die Jahre immer weiter an seinen nicht öffentlichen Ranking-Faktoren gefeilt. Anhand derer wird bestimmt, auf welcher Ergebnisposition eine Website zu einer bestimmten Suchanfrage ausgespielt wird.

Ende Januar passierte es nun: Ein vermutlich ehemaliger Yandex-Mitarbeiter veröffentlichte auf einer Hacker-Plattform eine 44,7 Gigabyte große Datei. Darin enthalten ist offenbar ein vollständiges Software-Repository des Yandex-Konzerns aus Juli 2022.

Die Daten umfassen den Quellcode aller Yandex-Dienste. Dazu zählen beispielsweise der KI-Assistent Alice, der Cloud-Speicher Yandex Disk, die Webanalyse-Software Yandex Metrika und eben auch die Suchmaschine, einschließlich des Bots zur Indexierung.

Gerade auf die letztgenannten Daten stürzen sich weltweit mittlerweile die SEO-Experten, um einmal im Klartext zu sehen, nach welchen Kriterien eine moderne Suchmaschine entscheidet und gewichtet, wie ein Suchergebnis entsteht.

Warum es zu diesem Leak gekommen ist, ob also persönliche Gründe vorlagen oder ein Erpressungsversuch vorliegt, ist derzeit nicht bekannt.

Es ist außerdem unklar, wie Yandex auf den Leak reagieren wird und ob es zu Änderungen in den nun öffentlich zugänglichen Ranking-Faktoren kommen wird.

Yandex was not hacked. Our security service found code fragments from an internal repository in the public domain, but the content differs from the current version of the repository used in Yandex services. […]

Yandex – Offical Statement

Welche Ranking-Faktoren sind für Yandex wichtig?

Durch den Yandex Code-Leak sind nun 1.922 Ranking-Faktoren bekannt geworden, die zumindest im Juli 2022 noch im Quellcode der Yandex-Suchmaschine zu finden waren. Dazu muss aber einschränkend erwähnt werden, dass bei weitem nicht alle der sichtbaren Ranking-Faktoren auch aktiv geschaltet waren.

Im Quellcode ist für eine Vielzahl an Faktoren ersichtlich, dass sie nicht oder nicht mehr aktiv waren oder noch gar nicht vollständig implementiert wurden. 244 Faktoren sind als “unused” und 988 als “deprecated” markiert. Das bedeutet, dass in Summe noch etwa 690 tatsächlich relevante Ranking-Faktoren für SEO-Analysen übrig bleiben.

Die meisten Faktoren davon sind wenig überraschend und überschneiden sich vermutlich mit denen von Google.

Für Yandex sind sowohl technische als auch inhaltliche Parameter wichtig. So wird großer Wert auf Page Speed und HTTPS, aber auch auf starke externe Verlinkungen und Textrelevanz gelegt. Soweit nichts Neues.

Bewertungen von Kommentare spielen ebenso eine Rolle wie das Alter eines eingehenden Links. Explizit wird eine Verlinkung auf Wikipedia zusätzlich belohnt.

Für Yandex kann nun schwarz auf weiß nachgelesen werden: Nutzersignale spielen eine Rolle für die Suchmaschinenplatzierung. SEO-Experten unterstellen dies auch immer wieder bei Google, auch wenn der Konzern das bisher strikt verneint.

Außerdem werden Websites mit vielen direkten Besuchern, geringer Absprungrate und guter Conversion mit Vorteilen in der Rankingberechnung belohnt.

Einen Bonus bekommt auch, werden den Analyse-Dienst Metrika von Yandex nutzt. Wer auf Dienste amerikanischer Wettbewerber wie Google (Google Analytics) oder Meta (JavaScript via Facebook) setzt, wird hingegen abgestraft.

Außerdem ersichtlich: Es macht für Yandex einen Unterschied, an welchem Wochentag und zu welcher Uhrzeit eine Suchanfrage gestellt wird.

Wer in Russland etwas im Internet sucht, wird den Begriff vielleicht googeln. Doch wahrscheinlicher wird er oder sie den Begriff yandexen.

Spiegel Online: “Yandex: Aufstieg und Fall des russischen Google-Konkurrenten”

Lassen sich die Erkenntnisse aus dem Yandex Code-Leak auf Google übertragen?

Die veröffentlichten Ranking-Faktoren stehen offiziell in keinem Zusammenhang zum übermächtigen Wettbewerber aus den USA. Es gibt aber deutliche Gemeinsamkeiten in der grundlegenden Techniken der beiden Suchmaschinen. Was bei Google das RankBrain ist, nennt sich bei Yandex MatrixNet. Beide Unternehmen nutzen ähnliche Modelle zur Berechnung eines PageRanks.

Ganz überraschend ist das nicht, denn für die Suche nach Fachkräften für die teils hochkomplexen Entwickleraufgaben fischen sowohl Yandex als auch Google weltweit im gleichen Becken. Ein Übergang von Mitarbeitern sowohl in die eine als auch die andere Richtung ist in den letzten Jahren immer wieder zu beobachten.

So spannend die Daten aus dem Code-Leak auch sein mögen: Wir können damit keine gesicherten Aussagen über die Arbeitsweise und Gewichtung von Ranking-Faktoren bei Google treffen. Für die SEO-Arbeit liefern die sichtbaren Parameter aber dennoch jede Menge Inspiration und es wird spannend zu beobachten, wie SEO-Experten Ranking-Faktoren aus dem Yandex Code-Leak aufgreifen werden, um deren Auswirkungen im Google-Index zu prüfen.

Software engineers from both companies go to the same conferences (SIGIR, ECIR, etc) and share findings and innovations in Information Retrieval, Natural Language Processing/Understanding, and Machine Learning. Yandex also has a presence in Palo Alto and Google previously had a presence in Moscow.

Search Engine Land: Yandex scrapes Google and other SEO learnings from the source code leak

Das Wichtigste in Kürze

Was ist der Yandex Code-Leak?

Am 25. Januar 2023 veröffentliche ein vermutlich ehemaliger Yandex-Mitarbeiter ein Software-Repository des Konzerns aus dem Juli 2022. Es enthält den Quellcode aller Yandex-Dienste, einschließlich der Suchmaschine und der zugehörigen Ranking-Faktoren.

Was ist an den Ranking-Faktoren bei Yandex besonders?

Nutzersignale (User Signals) spielen bei Yandex eine Rolle. Ebenso das Alter eines eingehenden Links. Websites, die bei Wikipedia referenziert sind, werden belohnt. Websites, die den Webanalyse-Dienst Yandex Metrika nutzen auch.

Ist Google von dem Yandex Code-Leak betroffen?

Nein, es sind keine Daten von Google an die Öffentlichkeit gelangt. Anhand der nun verfügbaren Ranking-Faktoren von Yandex wird aber in der SEO-Szene lebhaft diskutiert, ob und mit welcher Gewichtung ähnliche Faktoren bei Google existieren und wie Websites darauf optimiert werden könnten.