Online zoekmachines worden elke dag door miljarden mensen gebruikt. Ze zijn erg belangrijk voor andere sectoren en hebben veel invloed op de economie, politiek en samenleving. De laatste jaren is er een grote discussie ontstaan over de vraag: leveren sommige zoekmachines betere resultaten omdat hun algoritme beter is, of omdat ze toegang hebben tot meer gegevens van eerdere zoekopdrachten?
Als het komt door een beter algoritme, is het misschien beter om niet in te grijpen in de markt. Zo blijven ondernemers gestimuleerd om te innoveren, en dat geldt ook voor hun mogelijke concurrenten. Maar als het vooral komt door toegang tot meer gegevens, zou een verplichting om gegevens te delen – een idee dat in de EU-wet Digital Markets Act al wordt besproken – innovatie kunnen bevorderen. Dit zou voordelen kunnen opleveren voor alle gebruikers van zoekmachines.
Onderzoek en resultaten
In dit artikel worden de resultaten van een samenwerking met een kleine zoekmachine, Cliqz, gepresenteerd. Zij boden niet-gepersonaliseerde zoekresultaten voor een willekeurige set zoekopdrachten en voerden een experiment uit. Hierdoor konden we resultaten binnen één zoekmachine vergelijken. Daarnaast verzamelden we niet-gepersonaliseerde zoekresultaten van Google en Bing voor dezelfde zoekopdrachten, in dezelfde periode en hetzelfde land. We vroegen onafhankelijke beoordelaars om de kwaliteit van de resultaten te beoordelen op een schaal van 1 tot 7, zonder te zeggen van welke zoekmachine de resultaten kwamen. Dit gaf ons ook inzicht in verschillen tussen zoekmachines.
De bevindingen tonen aan dat verschillen in de kwaliteit van zoekresultaten verklaard worden door zoekopdrachten naar minder populaire termen, waarvoor een algoritme minder gegevens kan gebruiken. Deze inzichten worden ondersteund door een experiment waarin we het algoritme van de zoekmachine constant houden, maar variëren hoeveel gegevens het als input gebruikt. Dit levert causaal bewijs dat meer gebruikersgegevens over zeldzame zoekopdrachten zoekmachines in staat stellen betere resultaten te leveren. Opvallend is dat 74% van het verkeer in onze gegevens afkomstig is van “zeldzame zoekopdrachten”. Dit is dus de cruciale dimensie van concurrentie waarin een zoekmachine goed moet presteren om gebruikers aan te trekken.
Implicaties
De resultaten suggereren dat verplicht delen van gebruikersgegevens een passende maatregel kan zijn, omdat dit nieuwkomers zoals Cliqz in staat zou stellen om succesvol te concurreren met gevestigde spelers zoals Google. Dit zou Cliqz in staat stellen om ook voor zeldzame zoekopdrachten kwalitatief hoogwaardige resultaten te leveren. In tegenstelling tot andere contexten schaadt deze maatregel de gevestigde partij niet direct, omdat gebruik wordt gemaakt van het niet-rivaliserende karakter van informatie: de gevestigde speler kan de gegevens nog steeds gebruiken. Alleen de exclusiviteit van gegevens wordt verminderd. Uiteindelijk zouden gebruikers hiervan profiteren.