Online zoekmachines worden elke dag door miljarden mensen gebruikt. Ze zijn erg belangrijk voor verschillende sectoren en hebben veel invloed op de economie, politiek en samenleving. De laatste jaren is er discussie ontstaan over de vraag of sommige zoekmachines betere resultaten leveren vanwege een beter algoritme, of omdat ze toegang hebben tot meer gegevens van eerdere zoekopdrachten.
Als de kwaliteit van zoekresultaten vooral afhangt van betere algoritmes is ingrijpen in de markt misschien niet nodig. Zo blijven ondernemers en hun mogelijke concurrenten gestimuleerd om te innoveren. Maar als het vooral komt door toegang tot meer gegevens, zou een verplichting om gegevens te delen – een idee dat in de EU-wet Digital Markets Act al wordt besproken – innovatie kunnen bevorderen. Dit zou voordelen kunnen opleveren voor alle gebruikers van zoekmachines.
Onderzoek en resultaten
Om dit te onderzoeken, werd er samengewerkt met de kleine zoekmachine Cliqz. Er werd een experiment uitgevoerd met niet-gepersonaliseerde zoekresultaten voor een willekeurige set zoekopdrachten. Hierdoor konden resultaten binnen één zoekmachine vergelijkt worden. Daarnaast werden vergelijkbare gegevens van zoekmachines Google en Bing verzameld in dezelfde periode en hetzelfde land. Onafhankelijke beoordelaars beoordeelden de kwaliteit van de resultaten op een schaal van 1 tot 7, zonder te zeggen vna welke zoekmachine de resultaten kwamen. Dit gaf inzicht in verschillen tussen zoekmachines.
De resultaten laten zien dat kwaliteitsverschillen vooral ontstaan bij minder populaire zoekopdrachten, waarvoor minder gegevens beschikbaar zijn. Dit werd bevestigd in een experiment waarin hetzelfde algoritme werd gebruikt, maar waarbij de hoeveelheid inputgegevens werd gevarieerd. Hieruit blijkt dat een grotere hoeveelheid gebruikersgegevens zoekmachines in staat stelt om betere resultaten te leveren, vooral bij zeldzame zoekopdrachten. Opvallend genoeg bestaat 74% van het verkeer in de dataset uit dit soort zoekopdrachten, wat het een cruciale factor maakt in de concurrentie tussen zoekmachines.
Implicaties
De bevindingen suggereren dat het verplicht delen van gebruikersgegevens nieuwkomers zoals Cliqz zou kunnen helpen om te concurreren met gevestigde spelers zoals Google. Hierdoor zouden zij ook bij zeldzame zoekopdrachten hoogwaardige resultaten kunnen leveren. Tegelijkertijd blijft de gevestigde partij toegang houden tot dezelfde gegevens, waardoor er geen direct nadeel ontstaat. Alleen de exclusiviteit van de data wordt verminderd. Uiteindelijk zouden gebruikers hiervan profiteren door betere en eerlijkere zoekresultaten.