Auto-completami

Avete mai notato che, quando si fa una ricerca su Google, già mentre si digitano le prime lettere il sistema rimanda una serie di consigli e previsioni su quello che potremmo cercare? La funzione, spesso molto utile, si chiama “Autocomplete”. I grandi server di Google, per spiegare in poche parole come funziona, non fanno altro che registrare tutte le ricerche maggiormente effettuate nel mondo per proporle poi all’utente facendogli, in molti casi, risparmiare tempo. Ci sono ricerche molto popolari, come ad esempio “come ci si cancella da Facebook?” oppure “come cancellare un virus” e così via, e già scrivendo solamente “come”, nella barra di ricerca iniziano ad apparire i risultati più pertinenti. Comodo, no?

In pochi sanno, però, che attraverso la funzione “Autocomplete” è possibile fare una vera e propria analisi sociologica del Web, sia italiano che mondiale. Come? Semplicissimo. Facendo delle prove. Inserendo delle parole molto generiche come ad esempio “come”, “come si fa”, “perché” o “quando” escono fuori dei risultati molto, molto interessanti. E, in alcuni casi, “devastanti”.

Proviamo a scrivere “come”, ad esempio. Scopriremo che in 9.490.000 hanno chiesto a Google “come si fa l’amore?”, in 1.540.000 “come si bacia?”, in 3.200.000 “come far soldi?”. Mentre “solo” in 903.000 “come conquistare una ragazza?”. Come se chiedere a Google fosse meglio che chiedere al fratello maggiore o a un amico più grande!

Proviamo, ancora, a scrivere “perché”: in 23.700.000 hanno chiesto “perché a me?”, magari in un momento di sconforto. Mentre in 40.900 “perché Michael Jackson è bianco?”, in 1.820.000 “perché te lo dice mamma?” (italiani tutti mammoni?) e 1.610.000 “perché si tradisce?”. Ma non è finita: scrivendo “quando” notiamo che in 5.740.000 hanno chiesto “quando inizia uomini e donne?” (no comment, ndr), in 531.000 “quando fare il test di gravidanza?” e in 2.030.000 “quando nasce un amore?”. Per la serie: se non lo sai tu, come fa a saperlo un motore di ricerca?

Ma le domande più incredibili si ottengono, di certo, provando con termini un po’ più specifici. Con “è possibile”, infatti, in 31.600 (tutti matematici in futuro!) si chiedono se sia “possibile calcolare l’area di un pene”. Con “perché le donne”, invece, otteniamo: “perché le donne tradiscono?” (255.000), “perché le donne vanno al bagno in due?” (544.000) e “perché le donne sono stronze?” (117.000). Ma soprattutto a battere il record è “perché le donne non la danno?” (2.270.000). Con “perché gli uomini”, invece, troviamo solamente “perché gli uomini preferiscono le stronze?” (17.000) e “perché gli uomini hanno i capezzoli?” (131.000).

Abbiamo provato anche a inserire altri termini, e – senza farla troppo lunga – ne passiamo in rassegna alcuni. “Come si fa a capire” “se una tartaruga è maschio o femmina?”, si chiedono in ben 36.600. Mentre con “posso rimanere incinta” il risultato che fa più riflettere, tra gli altri, è quello delle 850.000 ragazze che hanno scritto “da un cane”.

Passiamo, invece, al capitolo delle parentele. “La mia ragazza”, si lamentano in ben 2.350.000, “non vuole fare l’amore”. Mentre “il mio ragazzo” “ha il pene piccolo” per 87.500 pulzelle e ahinoi “viene subito” per ben 1.910.000 donne! Mogli e mariti, invece, hanno superato questi problemi di giovinezza e parlano più che altro di tradimenti: “mia moglie” “con un altro” per 1.550.000 mariti, mentre “mio marito” “l’altra volta mi ha scoperto” per ben 1.620.000 mogliettine. Un po’ più di perversione, invece, con i termini “mia madre”, che per 108.000 giovincelli “ha sessant’anni e più la guardo e più mi sembra bella” e “scopa con i miei amici” per 145.000 poveri figlioletti. Parliamo delle sorelle: “mia sorella” “si spoglia” per 17.800 porcelloni e “puzza” per ben 107.000 fratelli! Anche le mamme non sono da meno: “mio figlio” “mi eccita” per ben 57.300 mammine, mentre “sarà un mostro” per 679.000 genitori disperati.

Ci saremmo immaginati di trovare decine e decine di segnalazioni sui propri datori di lavoro, e invece “solo” 2.250.000 persone hanno ammesso che il capo “ci prova”. Mentre alla domanda “mi piace” sono le donne a farla da padrone: hanno risposto “grosso” in 1.400.00 e “ingoiare” in 43.900.

Per concludere la nostra ricerca sociologica non potevamo non vedere come se la cavano gli italini con i problemi a letto. E così scopriamo che scrivendo “perché il pene” otteniamo 227.000 risultati con “perché il pene puzza?”, 896.000 con “perché il pene non entra?” e 36.400 con “perché il pene è storto?”. Mentre, incredibilmente, inserendo il termine “la vagina” non otteniamo alcun risultato. Sarà perché gli uomini italiani sono tutti super-esperti?

Per il momento abbiamo concluso la carrellata delle ricerche più incredibili e più diffuse fatte dagli italiani su internet. E voi, cari lettori, avete trovato termini interessanti? Fatecelo sapere nei commenti qui sotto!

La home-page di Google è illegale?

Guai giudiziari per Google, accusata di violare le leggi californiane a causa della sua riluttanza ad inserire direttamente nella home page un link alla pagina della politica sulla privacy. “A Google è stato chiesto di inserire la parola privacy, una parola di sole sette lettere, accanto agli altri link che portano alle pagine di informazioni sulla ricerca e sulla società. Una parola piccola che però nel mondo della privacy è molto importante”, ha spiegato Beth Givens della Privacy Rights Clearinghouse.

Tutto è partito da una segnalazione proveniente da alcuni blog del New York Times, secondo cui Google non si sarebbe adeguata all’Online Privacy Protection Act del 2003 (la legge californiana sulla privacy, per intenderci): la legge prevede che ogni sito che abbia dietro un’attività commerciale e raccolga informazioni private degli utenti debba segnalare bene in vista nella propria home page un link alla propria pagina che spiega la politica dell’azienda nei confronti della privacy.

Google dal canto suo si difende, spiegando che la politica sulla privacy è facilmente individuabile seguendo il link “About Google” in fondo alla home page, e che non aggiunge un altro link per “questioni estetiche”; le associazioni dei consumatori però non ci stanno, spiegando che trovare la pagina non è abbastanza intuitivo e non è semplicemente questione di un paio di click. C’è, insomma, una vera e propria guerra da parte delle associazioni dei consumatori nei confronti di Google, accusata (ne abbiamo parlato spessissimo) di conservare le nostre e-mail, i nostri indirizzi Ip insieme ai siti da noi visitati e un mucchio di altre informazioni sulle nostre abitudini online.

In effetti però abbiamo provato noi stessi a raggiungere la pagina della privacy di Google (tra l’altro molto ben fatta) e ci sono voluti… solamente due click. Il primo nella home page di Google (versione internazionale) su “About Google”; il secondo proprio in fondo al centro della pagina “About”: “Privacy policy”. Insomma: di certo non si trova all’interno della home page, ma con una ricerca di dieci secondi l’abbiamo trovata, sia nella versione inglese che in quella italiana. Tra l’altro, scrivendo “privacy policy” o “google privacy policy” nel campo di ricerca del motore, il primo risultato è sempre la pagina della politica sulla riservatezza di Google.

Microsoft rinuncia a creare una grande biblioteca virtuale

→ D@di per Downloadblog.it

Sembra che Microsoft abbia deciso di lasciare a Google il campo libero per quanto riguarda le biblioteche virtuali e le “scannerizzazioni” di libri. Secondo quanto si apprende, digitalizzare libri e archiviare riviste accademiche non fa più parte dei piani della società per rilanciare il settore della ricerca, ha spiegato Satya Nadella, senior vice president della divisione Microsoft ricerca e pubblicità.

La decisione farebbe parte di una nuova strategia per cercare di guadagnare terreno dopo aver perso la possibilità – almeno per il momento – di acquistare Yahoo!. La software-house di Redmond, così, ha annunciato che chi cercherà versioni originali di libri, riviste o trattati sarà reindirizzato, da parte di Live Search, verso siti “esterni al gruppo Microsoft”.

Forse non tutti ricordano che la società di Bill Gates era entrata nel business del book-scanning nel 2005, iniziando a fornire materiali alla Open Content Alliance, mentre nel 2006 aveva annunciato un servizio di ricerca libri integrato a Msn.

L’unica differenza con Google verteva sul copyright: mentre Big G sta cercando di stringere accordi con i numerosi editori che inizialmente gli avevano fatto causa, Microsoft si era da sempre dedicata alla scannerizzazione dei libri di publico dominio o di quelli concessi dagli stessi editori.

Ora, invece, la decisione di abbandonare tutto. “Crediamo – continua la Nadella – che la prossima frontiera della ricerca dovrebbe vertere sullo sviluppo di un modello di business per il motore di ricerca, il consumatore e il partner commerciale”. Come per dire che da ora in poi bisognerà cercare di ottimizzare i propri profitti collegando, attraverso i risultati della ricerca, utenti e partner pubblicitari.

Fino ad ora Microsoft aveva digitalizzato circa 750mila libri e 80 milioni di articoli di giornali e riviste; le copie verranno donate agli editori stessi, che potranno decidere cosa farsene.

Di certo Microsoft vorrà dedicarsi di più al commercio elettronico e alla ricerca, ma in questo modo lascia praticamente campo libero a Google e al suo progetto Book Search.

Ultime statistiche dai motori di ricerca: Google sale, giù tutti gli altri

→ D@di per Downloadblog.it

Sembra che la “lotta” per l’acquisto di Yahoo! da parte di Microsoft stia facendo rimanere in piedi solo un concorrente nel mondo dei motori di ricerca: Google. Secondo l’ultima classifica ComScore, Google rimane saldamente in testa per quanto riguarda la frequenza di utilizzo dei motori di ricerca, conquistandosi sempre di più la dicitura di “IL posto dove cercare”.

Secondo i dati relativi al mese di aprile, infatti, Google è cresciuta ancora (dal 59,8 al 61,1 per cento del mercato in un mese), mentre Yahoo!, Microsoft, Aol e Ask hanno perso, rispettivamente, lo 0,9, lo 0,3, lo 0,2 e lo 0,4 per cento. Come dire, più di sei utenti su dieci in tutto il mondo si affidano a Google per cercare su internet.

Vedremo ora, nei prossimi mesi, come reagirà il mercato, considerato che Microsoft intende sferrare (in primis tramite il suo nuovo servizio Cashback – attivo per ora solo negli Stati Uniti) un forte attacco a Google sul fronte della raccolta pubblicitaria.

Microsoft pagherà (più o meno) chi usa il suo motore di ricerca. Funzionerà, o è solo una mossa “disperata” anti-Google?

→ D@di per Geekissimo.com

Il potere di Google è ancora troppo spropositato rispetto a quello di Microsoft. E così la multinazionale di Redmond, a sorpresa, ha annunciato ieri che inizierà a pagare chi utilizzerà il suo servizio di ricerca Live Search per fare acquisti. Sì avete capito bene. In pratica, il colosso ha annunciato che rimborserà i clienti che acquisteranno online alcuni prodotti utilizzando il motore di ricerca Microsoft Live Search.

Il danaro, hanno spiegato, arriverà dalle tariffe che gli investitori pubblicitari pagheranno a Microsoft per vedersi comparire tra i primi risultati nelle ricerche. “Crediamo – ha spiegato Bill Gates in una conferenza stampa – che la ricerca può offrire sia agli utenti che agli investitori molte più possibilità di quante ne abbia ancora offerte, e con questo servizio puntiamo a diventare il servizio di ricerca commerciale più redditizio del Web“.

Al momento l’offerta sarà disponibile solo negli Stati Uniti. È previsto che le vendite al dettaglio online negli Stati Uniti raggiungano la cifra record di 335 miliardi di dollari all’anno nel 2012; tra l’altro, già ora il 68 per cento degli utenti che fa acquisti online arriva all’acquisto passando per un motore di ricerca.

Agli occhi di molti analisti, il programma di Microsoft sembra essere stato studiato apposta per raccogliere un po’ più di denaro dalla pubblicità, considerato il mancato accordo per l’acquisto di Yahoo! che ha portato l’azienda di Redmond sempre più lontana dal raggiungere gli ottimi risultati di Google. C’è addirittura chi si sbilancia, prevedendo che questa mossa porterà a una grande guerra dei prezzi tra Microsoft e Google.

Uomo accusato di pedopornografia si difende attaccando Google: “Era troppo facile trovarla”

La notizia di cui parliamo oggi ha davvero dell’incredibile. Un uomo che ha scaricato più di 16mila immagini erotiche (alcune delle quali contenti anche foto di minori) sta cercando di difendersi dalle accuse della polizia, accusando a sua volta i motori di ricerca di rendere troppo semplice l’individuazione di foto pornografiche.

Accade in Inghilterra, dove l’uomo, 67 anni, è stato “pizzicato” in flagrante dagli investigatori mentre riordinava il suo archivio. L’uomo si è però difeso spiegando di essersi iscritto a un “sito di notizie”, che però dava anche immagini di minori (alle quali comunque non ha nascosto di essere interessato).

La difesa dell’uomo, però, ci ha messo “il carico da 11″, spiegando che è tutta colpa dei motori di ricerca se l’accusato è caduto in tentazione: le immagini erano troppo facilmente reperibili.

Il mese prossimo arriverà la sentenza definitiva, e c’è da credere che se il giudice gli darà ragione, la decisione alzerà un vero e proprio polverone.

Wikia, un motore di ricerca deludente. Ecco la nostra prova su strada

→ D@di per Geekissimo.com

Probabilmente negli ultimi due giorni avrete letto su numerosi siti (spesso non specializzati) della presentazione di Wikia Search, il motore di ricerca che “dovrebbe” riuscire a combattere lo strapotere di Google. Un motore “human-powered”, con gli uomini alla base, di cui si parla da almeno un anno. In realtà, per il momento, si tratta di una mezza delusione. Per come è stato presentato, infatti, non offre nessuna potenzialità o novità “esilarante”, e forse sarebbe stato meglio se la presentazione fosse avvenuta un po’ più in là nel tempo, con un sistema almeno più “popolato” e completo.

Al momento, infatti, si tratta di un motore di ricerca molto modesto, basato sul codice open-source Nutch e, dato che l’indicizzazione è a una percentuale ancora minima, i risultati offerti dalla ricerca sono abbastanza scarsi. Non è tutto da buttare, ovviamente: interessante la possibilità, una volta visti tutti i risultati della prima pagina, di fare click su un bottone per visualizzarne automaticamente sotto i successivi 10 (invece di cambiare pagina).

All’interno della pagina della ricerca, in alto, saranno presenti dei piccoli riassunti che daranno informazioni generali sul termine cercato (se disponibili) e che rimanderanno, per approfondimenti, a una pagina del Wiki. Anche qui, ci sono pochissimi termini e ancora il database è tutto da costruire. Wikia, come anticipato, è anche un social network. Gli utenti, infatti, possono registrarsi e creare un proprio profilo, inserendo foto e interessi. Quando un altro utente effettuerà una ricerca, sul lato destro della pagina dei risultati appariranno le iconcine di tutti gli utenti registrati “interessati” a quel termine di ricerca. Sicuramente un servizio innovativo. Ma… a che serve?

Una volta che ci saranno centinaia di fotine, non sarà semplicemente una funzione inutile? Ovviamente non vogliamo stroncare il progetto, che sicuramente è interessante. L’unica cosa che diciamo è che molto probabilmente sarebbe stato molto più intelligente, da parte degli sviluppatori, rimandare di qualche mese il lancio, in modo da dare agli utenti la possibilità di lavorare su un sistema già concorrenziale. Chi di noi, infatti, si fiderebbe di effettuare una ricerca in Wikia senza confrontare ciò che offre Google?

Powerset, il motore di ricerca “naturale” che piace a bambini ed anziani

D@di per Geekissimo.com

Powerset, il motore di ricerca che offre risultati accettando domande di senso compiuto ha iniziato la sua fase di beta testing aperta a (quasi) tutti gli utenti. Il motore di ricerca, unico nel suo genere, è un importante esperimento di intelligenza artificiale, che permette, appunto, di “rompere i confini della ricerca per parole chiave”, inserendo intere frasi o domande nel campo di ricerca.

La tecnologia, in pratica, prende vantaggio dalla struttura naturale della lingua (in questo caso l’inglese) diventando un motore di ricerca user-friendly. Solo per fare un esempio, se vogliamo (è un esempio, ripeto) sapere quando e come Mediaset ha acquistato Endemol, con Google scriveremo una cosa tipo “Endemol Mediaset acquisto”, con Powerset invece potremo scrivere: “Quand’è che Mediaset ha acquistato Endemol?”.

Al momento la fase di beta testing pubblica è aperta, dicevamo, solamente per chi si iscrive e chi è fortunato ad ottenere un invito, e indicizza solamente gli articoli di Wikipedia in inglese. Piano piano, invece, verrà aperta a tutti e, ovviamente, indicizzerà tutto il Www. Certo, potrebbe dire qualcuno, a cosa serve un motore di ricerca del genere, quando Google con anni di esperienza è sempre il migliore nel trovare i risultati giusti?

A mio parere si tratta di un importante test. Innanzitutto per quanto riguarda l’intelligenza artificiale e l’interazione uomo-macchina. Quanti di voi hanno studiato, o studiano, la psicologia dei processi cognitivi, sanno benissimo quanto sia difficile riuscire a far capire al computer il linguaggio umano e tutte le sue sfaccettature. Quindi già il fatto che il motore di ricerca riesca a capire esattamente cosa vogliamo è un ottimo punto di partenza. E poi, pensiamo anche agli anziani o ai bambini che per la prima volta si accostano all’uso del computer e della rete: non è molto più semplice fare una ricerca scrivendo la domanda vera e propria, piuttosto che le parole chiave?

Cercare nel Web in modo assolutamente anonimo? Qualcosa inizia a muoversi

I motori di ricerca – probabilmente lo sapevate già – conservano tutte le tracce delle nostre richieste e dei siti Web visitati per circa 18 mesi. L’archivio comprende indirizzi Ip, chiavi di ricerca, cookies, nomi utente e tutta una serie di dati che possono portare facilmente alla nostra identificazione e tracciabilità.

Se i motori di ricerca conservano queste tracce per motivi di sicurezza, certamente questi dati possono essere però oggetto anche di molte attenzioni da parte di cracker e spammer senza scrupoli che, se venissero in contatto con uno di questi database, avrebbero come per magia e in un attimo una radiografia completa di tutte le nostre attività e dei nostri interessi. Ma ora, da Ask.com, arriva il modo di cercare nel Web in maniera assolutamente anonima.

La nuova funzione, chiamata appunto AskEraser, se attiva cancella ogni forma di nostra attività di ricerca entro poche ore da tutti i server Ask. Una volta impostato il filtro su ON (il link per impostarlo è in alto a destra nella pagina principale del sito), un cookie si ricorderà della nostra scelta e rimarrà attivo per 24 mesi (dopodiché bisognerà impostarlo nuovamente).

Ovviamente esiste anche un sistema analogo per Google, che però non è offerto dal motore di ricerca, bensì da un servizio a parte chiamato Googlonymous, che filtra il nostro Ip in modo che non arrivi ai server di Big G.

Google inizia a perdere colpi. O no?

D@di per Geekissimo.com

Oggi mi sono imbattuto in un interessante articolo che parla dei risultati delle ricerche di Google. Forse non ci avevate mai fatto caso, ma quando effettuiamo una ricerca con Google, questo ci fornisce, nella pagina dei risultati della ricerca, anche il numero di pagine che ha trovato (come si vede anche dalla foto). Ma il numero è assolutamente approssimativo: solitamente, infatti, l’utente medio guarda solo la prima e la seconda pagina (quindi i primi venti-trenta risultati); inoltre, nella maggior parte dei casi (per “motivi di efficienza”) Google dà la possibilità di visionare solamente i primi mille risultati.

Il motivo dell’approssimazione, dicevamo, è che fornendo un numero non precisissimo Google – spiegano proprio dal quartier generale del motore di ricerca – “può offrire risultati di qualità in brevissimo tempo“. Ma ultimamente, si legge nell’articolo, qualcosa è cambiato nell’algoritmo che calcola il numero di risultati. Un’inchiesta, infatti, ha svelato grandi differenze tra un termine cercato nel maggio del 2007 e, lo stesso termine, cercato ieri: a maggio Google offriva oltre 15 milioni di risultati, ieri invece ne offriva solo due milioni. E non è tutto.

Per la stessa ricerca, Yahoo! offre quasi 20 milioni di risultati, Microsoft 7,7 milioni e Ask 4 milioni: questo significa che tre altri motori di ricerca mostrano molte più pagine di Google. E questo avviene nella maggior parte delle situazioni e con quasi tutti i termini cercati. Big G inizia a diventare competitivo e a superare gli altri – incredibile – solamente con ricerche complesse dai tre termini in su. Una spiegazione prova a darla Matt Cutts, capo del Google Webspam team, che spiega come il motore di ricerca abbia iniziato a trattare i sottodomini allo stesso modo delle directory.

“Per diversi anni – si legge nel suo blog – Google ha usato l”host crowding’, cioè la possibilità di mostrare fino a due risultati da ogni hostname/sottodominio di un dominio. L’approccio funziona molto bene per mostrare uno o due risultati da ogni sottodominio, ma abbiamo avuto contestazioni perché per alcuni tipi di ricerche, Google mostrava pagine piene di risultati tutti da uno stesso dominio. Per questo nelle ultime settimane abbiamo cambiato i nostri algoritmi per far sì che questo non accada più in futuro”.

Ma in effetti, quante volte ci capita di andare oltre la terza, quarta, quinta pagina di una ricerca?

I motori di ricerca dovrebbero indicizzare anche i siti-truffa?

D@di per Geekissimo.com

La domanda che mi e vi pongo oggi è la seguente: è giusto che i motori di ricerca indicizzino siti che portano a contenuti vietati, contro la legge o contenenti truffe? “A pelle” potremmo rispondere che non è giusto; ma Google, Yahoo!&co. rimandano all’utente risultati in modo automatizzato, i cui filtri spesso non riescono a bloccare i contenuti vietati o illegali. Perché vi faccio questa domanda e perché il post ha attinenza con il nostro Paese?

Ecco la storia: qualche giorno fa sono arrivate alle autorità competenti molte segnalazioni, da parte di utenti di tutto il mondo, su un sito che truffava i consumatori vendendo a prezzi stracciati diverse tipologie di prodotti. Il tutto non accettando pagamenti con carta di credito: chi voleva acquistare i beni doveva inviare il denaro ad un indirizzo in Italia. Purtroppo, decine e decine di persone sono cadute nella trappola, spendendo centinaia di Euro ognuno, tanto che la vicenda è stata soprannominata “Italian job”.

Ovviamente – lo sanno tutti – quando si fa shopping online su siti che non sono stra-conosciuti è buona norma stare molto attenti ed essere sempre “sul chi-va-là”. È ovvio, ad esempio, che se ci troviamo su un sito di shopping-online che non accetta carte di credito, proprio questo fattore può rappresentare un campanello d’allarme. Purtroppo non abbiamo detto tutto: il sito in questione non solo era indicizzato in Google, ma anche in Google Products, il motore di ricerca specializzato in acquisti online.

La soluzione? Difficile a dirsi. Come sempre ci sono due facce della stessa medaglia: c’è chi afferma che i motori di ricerca hanno il diritto di indicizzare tutto ciò che trovano sul Web, che il contenuto sia vietato o no. Sta poi all’utente decidere se fidarsi o meno. E c’è, invece, chi dice che i motori di ricerca dovrebbero stare molto più attenti, potenziando i propri filtri di sicurezza affinché ignari cittadini non cadano nelle trappole delle truffe. Qual è il vostro punto di vista? Con quale delle due opinioni siete d’accordo?