-->
1. LE MONDE DIPLOMATIQUE - octobre 2003 - Pages 28 et 29 |
|
1. Le Monde diplomatique - November 2003 |
-->
-->
2. Choix silencieux des moteurs de recherche |
|
2. HOW AN ONLINE SEARCH ENGINE INFLUENCES ACCESS TO INFORMATION |
-->
-->
3. Le monde selon Google |
|
3. Telling Google what to think |
-->
-->
4. Par Pierre Lazuly |
|
4. By PIERRE LAZULY (Translated by Gulliver Cragg) |
-->
-->
5. Auteur des Chroniques du menteur , et animateur de « L’autre portail » |
|
5. Pierre Lazuly manages and writes for the French-language websites menteur.com and rezo.net |
-->
-->
6. Internet, avec ses 3 milliards de pages, est souvent décrit comme la plus complète des encyclopédies : une incomparable documentation mise gracieusement à notre disposition, et des outils qui savent répondre dans la seconde à la moindre de nos interrogations. Les moteurs de recherche sont si performants qu’il suffit de quelques mots épars pour retrouver une information quand la mémoire nous fait défaut. |
|
6. THE 3bn pages of the internet are the ultimate encyclopaedia : an incompar able quantity of information made available through tools that can answer almost any request in seconds. The web’s search engines are so powerful that, with a just a few words to guide them, they can retrieve information on unknown topics. |
-->
-->
7. Ces outils incontournables sont, paradoxalement, de moins en moins nombreux : seules quatre entreprises américaines parviennent encore à proposer à un public mondial un service de qualité. Avant de prétendre aiguiller l’internaute dans un volume de données sans cesse croissant, il faut en effet pouvoir mobiliser des milliers d’ordinateurs pour parcourir la Toile et répertorier l’information disponible. Mais il faut surtout savoir en extraire les pages les plus pertinentes. C’est cette capacité, l’« intelligence » du moteur de recherche, qui en fera ou non le succès. |
|
7. Surprisingly, ever fewer of these vital tools survive. Just four companies in the United States now provide the entire world’s quality net search services. But the amount of data that has to be assimilated to point the inquirer in the right direction is increasing : thousands of computers are used to scour the web and sort information. The most important aspect is knowing how to recognise the most relevant pages, which constitutes a search engine’s intelligence and determine its success or failure. |
-->
-->
8. Google l’a prouvé, en devenant en moins de trois ans le moteur de recherche le plus employé au monde : son approche novatrice lui permettait en général de proposer, dès la première page de résultats, l’information recherchée. |
|
8. Google proved this when it became the most popular search engine on the web in less than three years. Its fresh approach meant it could usually display the required information on its first page of results. |
-->
-->
9. Le bouche-à-oreille fut immédiat : les initiés encourageaient leurs amis à utiliser ce moteur « génial », et Google allait passer de 10 000 requêtes par jour, début 1999, à plus de 200 millions au printemps 2003 : 53 % des requêtes mondiales lui sont désormais confiées, au point que nombre de ses 70 millions d’utilisateurs en viennent à assimiler l’Internet tout entier à cet incomparable outil. |
|
9. The word quickly spread. Those in the know encouraged their friends to use Google and it went from 10,000 searches a day in 1999 to more than 200m in spring 2003. Google now runs 53% of the world’s internet searches and its ubiquity means that many of its 70 million users identify it with the internet itself. |
-->
-->
10. « Google est insensiblement devenu un instrument essentiel qui dépasse largement l’idée qu’on se fait généralement d’un moteur de recherche , résume le journaliste Francis Pisani. Je n’interrogeais plus seulement le moteur de recherche pour avoir accès à des sites contenant de l’information. Les résultats affichés en réponse à une question sont suffisants et les sites dont il donne la référence ne fonctionnent plus que comme instrument de vérification ». |
|
10. “Google has discreetly established itself as an essential tool whose role goes way beyond the usual idea of a search engine,” says journalist François Pisani. “I don’t just use it to find sites containing information. The nature of the results that come up is answer enough for many of my questions and the sites referred to are now just a means of verification.” |
-->
-->
11. La suprématie de Google n’est cependant pas sans soulever de réelles interrogations : comment un algorithme, si « génial » soit-il, peut-il choisir les dix réponses « les plus pertinentes » pour la requête « Irak », sur trois millions de pages contenant ce mot ? |
|
11. But Google’s supremacy leads to serious questions : how can an algorithm, however ingenious, choose the 10 most relevant responses to the request “Iraq” from the 3m pages containing this word ? |
-->
-->
12. Comme tout moteur de recherche, l’outil souffre en premier lieu d’une limitation importante : il ne peut proposer que l’information offerte au grand public. Si personne n’a jugé bon de publier d’article sur les moeurs du gypaète barbu (pour reprendre l’expression chère à Alexandre Vialatte), toute recherche sur ce thème restera vaine : en faisant « appel à Internet », on n’interroge pas l’ensemble des connaissances disponibles, mais seulement celles que différents contributeurs - universités, institutions, médias, particuliers... auront choisi de proposer en libre accès (au moins pour un temps). La qualité de cette offre joue donc un rôle primordial dans la pertinence des réponses proposées. |
|
12. Like any search engine, Google has a fundamental limitation : it can only bring up publicly available information. If no one has published an article on the habits of the bearded vulture, any search for information on the bird will be fruitless. When you search the net you are not examining all available knowledge, but only what contributors - universities, institutions, the media, individuals - have chosen to make freely available, at least temporarily. The quality of it is essential to the relevance of the results. |
-->
-->
13. Or, si le nombre total de pages accessibles ne cesse de progresser, certaines sources institutionnelles ont volontairement appauvri leurs sites. Au lendemain du 11 septembre 2001, nombre de sites officiels aux Etats-Unis ont ainsi été expurgés de données « sensibles » - comme ce site de l’armée américaine qui présentait fièrement au grand public ses huit entrepôts d’armes chimiques -, mais un bon nombre d’informations civiles ont aussi été retirées. Geographical Information Services a interdit l’accès à ses cartes du réseau routier, tandis que l’Etat de Pennsylvanie retirait les plans de ses infrastructures de télécommunications, de ses écoles et de ses hôpitaux. Sous couvert de lutte contre le terrorisme, certaines entreprises ont fait disparaître des informations que les groupes environnementaux n’avaient pu obtenir qu’au terme d’âpres batailles : des producteurs californiens d’électricité ont ainsi retiré les données relatives aux émissions polluantes de leurs centrales électriques... |
|
13. And although the total number of web pages grows unstoppably, some institutional information sources have deliberately reduced their content. Immediately after 11 September 2001, a number of official sites in the US deleted all sensitive data : one US army site had until then proudly shown the world its eight chemical weapons warehouses. Much civilian information was also removed. Geographical Information Services denied access to road maps, while the State of Pennsylvania shut down a web service that gave people access to charts of its telecommunications network including locations of school districts, hospitals and microwave sites. Some companies used the struggle against terrorism as an excuse to get rid of information that environmental groups had fought tough battles to release. California electricity gener ators withdrew data on their power stations’ pollution emissions. |
-->
-->
14. L’effondrement de la nouvelle économie, en 2001, a lui aussi contribué à ce retrait : les éditeurs en ligne sont de plus en plus nombreux à réserver leurs articles à leurs seuls abonnés. Cette stratégie, visant à réaliser quelques recettes supplémentaires, a toutefois un revers : leur disparition de la Toile. Les sites auxquels on n’accède que sur abonnement (même gratuit) sont en effet ignorés par les moteurs. Aussi, même si le New York Times a publié le mois dernier une remarquable enquête sur les moeurs du gypaète barbu, celle-ci ne vous sera pas proposée. La majorité des articles de presse sont ainsi devenus virtuellement invisibles. |
|
14. The collapse of the new economy in 2001 also contributed to a reduction in information. More web publishers now reserve their articles for subscribers. This strategy, aimed at increasing revenue, makes sites seemingly disappear. Pages only accessible to subscribers (even free ones) are ignored by search engines. Even if the New York Times had published a remarkable investigation into the habits of the bearded vulture only last month, it wouldn’t come up on a web search. Most of the press is now almost invisible. |
-->
-->
15. Dans le même temps, de nouveaux acteurs s’appropriaient le réseau. Des entreprises désireuses de s’assurer une visibilité en faisaient un support privilégié de leur communication ; des organisations militantes y découvraient un autre moyen de promouvoir leur cause... Les internautes, surtout, créaient toujours davantage de sites personnels : l’« autopublication », autrefois réservée aux plus technophiles, s’est démocratisée avec l’apparition d’outils plus simples à utiliser. |
|
15. New players are taking over the net. Com panies wanting to increase their visibility make it their premier communication tool ; militant organisations find it a great way of promoting their causes. And it is becoming more common for web-surfers to create their own personal sites. Self-publishing, once the preserve of geeks, has been democratised thanks to easier-to-use software. |
-->
-->
16. Au milieu des années 1990, confrontés à ce flux d’informations supplémentaires, deux étudiants en informatique de l’université américaine de Stanford, Sergey Brin et Larry Page, suivent une intuition : un moteur de recherche basé sur l’étude mathématique des relations entre les sites produirait de bien meilleurs résultats que les techniques rudimentaires employées à l’époque. Persuadés que les pages les plus « pertinentes » sont celles qui sont les plus fréquemment citées (celles que les autres sites ont choisi de référencer à l’aide de liens hypertextes), ils décident d’en faire leur projet d’études et posent les bases d’un moteur plus « mathématique », qu’ils baptiseront Google à la création de leur entreprise, en septembre 1998. |
|
16. Faced with the influx of information in the mid-1990s, two IT students at Stanford University, Sergey Brin and Larry Page, had an idea : a search engine based on a mathematical analysis of the relationships between websites would produce far better results than the basic techniques then in use. Convinced that the pages with the most links to them on other sites must be the most relevant ones, they decided to test this thesis as part of their studies, and did the basic work for a mathematical search engine. They founded their company in September 1998 - Google. |
-->
-->
17. Pour évaluer la « pertinence » des pages de la Toile, Brin et Page inventent le « PageRank », une échelle de valeurs propre à Google. La valeur d’une page Web y est sans cesse réévaluée en fonction du nombre de citations dont elle fait l’objet. Les sites isolés, destinataires d’aucun lien hypertexte, demeurent ainsi peu visibles, sans « légitimité ». Les sites abondamment cités deviennent en revanche, aux yeux de Google, des sites de référence. Cet algorithme original donne des résultats impressionnants. |
|
17. To assess the relevance of web pages, Brin and Page invented PageRank, Google’s special page evaluation system. The rank of a web page is constantly re-adjusted according to how many, and which other, sites carry links to it. The profile of isolated sites to which no one has provided a hyperlink remains low and so they are thought to be without legitimacy. Google considers sites that are frequently linked to as key pages. This novel algorithm produces impressive results. |
-->
-->
18. Le système présente pourtant déjà un inconvénient : les sites nouvellement créés sont handicapés et ne deviendront visibles que s’ils parviennent à attirer l’attention de sites déjà bien établis. « PageRank repose sur la nature purement démocratique du Web » , affirment les fondateurs de Google, qui doivent néanmoins concéder que « les votes issus de pages elles-mêmes importantes comptent plus et aident à rendre d’autres pages importantes » . Une démocratie étonnante, où les acteurs déjà influents disposent d’un droit de vote beaucoup plus important que les nouveaux entrants. |
|
18. But a problem presents itself. Newly created sites are at a disadvantage : they will only become visible if they manage to attract the attention of well-established sites. Google’s founders say : “PageRank is based on the purely democratic nature of the web.” But they concede “votes from pages that are important themselves count for more, and boost the importance of other pages”. It’s a strange democracy where the voting rights of those in a position of influence are so much greater than those of new arrivals. |
-->
-->
19. Une anecdote rapportée par Andrew Orlowski dans The Register est instructive. Le 17 février 2003, un article publié à la « une » du New York Times décrivait le mouvement de protestation antiguerre comme l’émergence d’une seconde superpuissance. « Les immenses manifestations anti-guerre à travers le monde ce week-end, assurait-il, nous rappellent qu’il existe sans doute encore deux superpuissances sur la planète : les Etats-Unis et l’opinion publique. » Cette expression fut rapidement reprise par le secrétaire général des Nations unies, M. Kofi Annan. Une recherche sur l’expression « second superpower », confiée à Google les semaines suivantes, renvoyait bien à cette définition originale. |
|
19. Andrew Orlowski explained how on 17 February 2003, an article on the front page of The New York Times described the protest movement : “The huge anti-war demonstrations around the world this weekend are reminders that there may still be two superpowers on the planet : the United States and world public opinion.” The idea spread rapidly and the phrase was soon used by the United Nations secretary general, Kofi Annan. Over the following weeks, if you searched for “second superpower” on Google, this was the definition you got. |
-->
-->
20. Un universitaire de Harvard, James F. Moore, décidait alors d’allumer un contre-feu : le 31 mars, il inaugurait son site personnel par un article intitulé « La seconde superpuissance dévoile son beau visage ». Un texte des plus anodins, dans lequel le terme de « seconde superpuissance » réapparaissait dans une version édulcorée propre à séduire même un membre du Parti républicain. D’autres « techno-utopistes » allaient alors se reconnaître dans sa pensée et, par leurs recensions très influentes sur le réseau, faire de son obscur article « la » référence sur le sujet. De fait, un mois plus tard, 27 des 30 premières réponses proposées par Google pour la recherche « second superpower » renvoyaient à sa version aseptisée. James Moore, expert en stratégie économique, technologie et leadership, savait ce qu’il faisait. |
|
20. On 31 March James F Moore of Harvard University put on his personal website the title “The second superpower rears its beautiful head” heading an anodyne text that used the term “second superpower” to describe net-heads. (This application could seduce even a Republican party member.) Techno-utopians seized on Moore’s obscure article and made it a reference point. A month later, 27 of the first 30 results Google presented for the term “second superpower” pointed to Moore’s piece. Moore, an expert on economic strategy, technology and leadership, knew what he was doing. |
-->
-->
21. « Il aura fallu des millions de personnes de par le monde pour forcer " the Gray Lady" (le New York Times) à décrire le mouvement antiguerre comme la "deuxième superpuissance" ; il aura suffi d’une poignée de "weblogueurs" référençant son article pour que celui-ci, en vertu de l’algorithme PageRank de Google, bénéficie d’une légitimité telle que sa définition inoffensive écrase toutes les autres , constate Andrew Orlowski. Si le moteur de recherche était votre principale vision du monde, vous auriez du mal à croire que l’expression "deuxième superpuissance" puisse signifier autre chose. Son sens original a quasiment disparu. » |
|
21. Orlowski says : “Although it took millions of people around the world to compel the Gray Lady [the New York Times] to describe the anti-war movement as a ‘second superpower’, it took only a handful of webloggers to spin the alternative meaning to manufacture sufficient PageRank to flood Google with Moore’s alternative, neutered definition. If you were wearing your Google-goggles, and it was your primary view of the world, you would have a hard time believing that the phrase ‘second superpower’ ever meant anything else.” |
-->
-->
22. Pour Andrew Orlowski, l’anecdote révèle que « Google n’est pas "authentique", mais "synthétique" » : une recherche ne renvoie pas vers la principale référence sur le sujet, mais vers son acception la plus largement référencée. Un phénomène amplifié par la législation sur le droit d’auteur, qui interdit la publication en ligne des écrits qu’il protège. Si une recherche sur Raoul Vaneigem renvoie bien vers certains de ses textes (plusieurs de ses livres étant disponibles en ligne), vous n’obtiendrez en revanche, pour la plupart des auteurs, qu’une invitation à acquérir leurs ouvrages et, dans le meilleur des cas, la recension d’un livre faite par un internaute. Une situation que l’on pourrait comparer à celle d’une bibliothèque qui, devant renoncer au prêt gratuit de ses ouvrages, ne pourrait plus proposer que les fiches de lecture rédigées par ses adhérents. |
|
22. For Orlowski, this shows that “Google is not authentic but synthetic” since a search does not lead you to the principal reference on a subject, but to its most commonly referred-to application. Copyright legislation has exacerbated the problem : it forbids the publishing of copyrighted material online. A search for Raoul Vaneigem will lead you to his writings, since many of his books are available online, but type in the names of most writers and you will only get an invitation to buy their books, or at best, a review by another surfer. It is as though a library had to give up free loan of its books and replace them with summaries written by readers. |
-->
-->
23. Cette absence d’écrits de référence favorise les prises de position sur ce terrain de jeu idéologique. Et, curieusement, ce pouvoir symbolique _ cette capacité de faire prévaloir sa perception d’un sujet donné _ est l’un des rares à échapper encore à la structure habituelle de distribution du pouvoir. L’idéologie dominante n’y est pas surreprésentée, bien au contraire : une recherche lancée sur le nom d’un ministre de l’intérieur adepte des charters vous orientera vers des associations de défense des sans-papiers ; interrogé sur un homme d’affaires, Google pourra négliger ses communiqués de presse et raviver le souvenir des scandales financiers auxquels il a été mêlé. |
|
23. This absence of reference points leads to much careful manoeuvring on the ideological playing field. Curiously, the symbolic power - the possibility of making your own perception of a subject the dominant one - is one of the few outside conventional power structures. The dominant ideology is not over-represented. Searching for the French home office minister in charge of charters will throw up charities that support asylum seekers. Asked about a businessman, Google could easily ignore press releases and unearth financial scandals. |
-->
-->
24. En réalité, le pouvoir d’influence des différents acteurs dépend surtout de leur degré d’appropriation du réseau : il ne suffit pas de développer un site, il faut également être capable de tisser des liens avec les autres sites et d’obtenir une reconnaissance de « ceux qui comptent » sur le réseau. |
|
24. The players’ influence depends mainly on their relationship with the net. Creating a website is not enough : you must also be able to foster links with other sites and get recognition from those that matter. |
-->
-->
25. Si beaucoup bénéficient ainsi en toute bonne foi de la reconnaissance de leurs écrits, d’autres savent exploiter savamment les faiblesses de l’outil. Certaines agences se font ainsi une spécialité de réaliser, pour le compte de divers lobbies, des sites d’information dont le contenu pourrait à première vue laisser penser à des dépêches d’agence. Cette objectivité apparente suffit souvent à leurrer l’internaute qui, croyant à une information sérieuse, pourra être tenté de la référencer sur son propre site... et donc de lui accorder un pouvoir symbolique dont elle pourra profiter par la suite. |
|
25. While many benefit in good faith from recognition of the content of their sites, others cunningly exploit weaknesses. Some companies specialise in producing, for the benefit of lobbies, information sites whose contents resemble business memos. Their apparent objectivity is often enough to seduce surfers into linking to them, bestowing on them valuable symbolic authority. |
-->
-->
26. Certains sujets sensibles, comme les organismes génétiquement modifiés ou le conflit israélo-palestinien, font ainsi l’objet d’une lutte acharnée dans laquelle chacun s’efforce de rendre son idéologie « plus légitime » aux yeux de Google. Au point que le responsable d’un site Internet de référence _ aux yeux de ce moteur de recherche tout au moins _ a récemment eu la surprise d’être démarché par un intermédiaire commercial d’un genre un peu particulier : « Je suis intéressé par l’achat de liens hypertexte sur votre site afin de promouvoir les sites de nos clients. Ces liens n’ont pas besoin d’être spécialement mis en évidence sur votre site, dans la mesure où nous n’en attendons pas de retombées directes en termes de visites. Votre site étant apprécié des moteurs de recherche, ces liens permettraient d’augmenter la visibilité de ces sites sur les moteurs. » Parmi ses clients, cet expert en renommée mentionnait sites financiers, agences de voyage et entreprises pharmaceutiques. |
|
26. Sensitive topics, such as genetically modified organisms or the Israeli-Palestinian conflict, are the object of bitter struggles between different parties trying to make their ideology seem the more legitimate to Google. The manager of a key website - key to the search engines, anyway - was surprised to receive a business proposition : “I am interested in buying hyperlinks on your site to promote our clients’ websites. There is no need for these links to be displayed prominently on your site : we are not expecting a direct increase in hits from this. Since your site is popular with the search engines, these links will make our sites more visible on them as well.” The expert who sent this counted financial sites, travel agents and pharmaceutical companies among his clients. |
-->
-->
27. C’est sans doute face à toutes les questions à caractère politique, sur lesquelles des points de vue radicalement différents coexistent sur la Toile, que Google montre vraiment ses limites : ses critères mathématiques peuvent privilégier de facto certaines opinions et accorder une pertinence indue à des écrits ne reflétant que l’opinion de quelques-uns. L’assise et la surreprésentation dont ont bénéficié les « premiers arrivés » sur le Réseau, la densité des liens qu’ils entretiennent (notamment à travers le phénomène essentiellement américain des weblogs), désignent - mathématiquement - les « maîtres à penser » actuels de Google. |
|
27. Google’s limits are most evident when confronted with political questions, where there are radically different points of view among web users. Its mathematical criteria give de facto priority to certain opinions and can confer undue importance on texts that represent the opinion only of a few. Those who got there first in net use are now so well-established that they enjoy a level of representation out of proportion to their real importance. The quantity of links they maintain (especially through the mainly US phenomenon of webloggers) (7) mathematically give them control of what Google thinks. |
-->
-->
28. Certes, l’outil a brillamment fait ses preuves pour les questions techniques ou pratiques. Mais il est des domaines où la pertinence échappe aux algorithmes. |
|
28. Google has proved brilliantly effective, technically and practically. But algorithms can’t always determine what is important. |
-->