Feed subscription » blog | » comments | » google+ | » mobi | » twitter

Čo všetko môžete získať pomocou googlu

searchingBol som veľmi prekvapený čo všetko má google zaindexované. Mená, heslá, prístupy, logy, kontá, správy a všetko, čo si niekto uložil na disk a nezakázal k tomu prístup. Perličkou pre množstvo ľudí bude určite prístup na stránky s erotickou tematikou. Áno aj k tomu sa dá dostať cez google. Určite sa pýtate, ako je to možné?

Jednoducho. Google funguje v podstate ako filter databáze a teda nerozlišuje (vo väčšine prípadov) či je výsledok morálne správny alebo nie a či ste vy “tá” zodpovedná osoba ktorej ho ukázať.

Na začiatok upozornenie: Článok vznikol hlavne pre upozornenie bezpečnostných chýb a lenivosti administrátorov.

Chyby programátorov
V podstate google nedokáže len tak vytiahnuť hocijaké heslo napr. z databáze. Tu v podstate ide o chyby programátorov, ktorí ukladajú heslá napr. do textového súboru a zabudnú zakázať robotom prístup k chráneným súborom, čo sa zabezpečuje pridaním súboru robots.txt do rootu webu. Keďže takto veľa programátorov nespraví, google zaindexuje každý súbor napríklad v priečinku admin či inom, kde máte možno uschované dôležité mená a heslá Vašich klientov či návštevníkov.

Ako na to?
Určite ste už nedočkavý ako sa k takýmto veciam prepracovať. Ešte dodám, že ďalej budem pokračovať rozdelením každého postupu do samostatnej sekcie, aby to bolo priehľadnejšie. K takýmto “nekalím” činnostiam sa dostanete v podstate úplne jednoducho tým, že sa pripojíte na stránky www.google.sk (uvádzam pre prípad že ste náhodou nepoznali, čomu však moc neverím) a teraz už stačí len správne sformulovať reťazec. Väčšina z Vás hľadá asi tak, že napíše text napríklad “inet” a čaká, akú stránku mu google “vypľuje”. Pri tomto “hacku” musíte však reťazce formulovať trošku inak a na to je dobre byť aspoň maličkou časťou programátor, alebo poznať máličko ako google funguje. Veľa sa dočítate na samotných stránkach www.google.sk avšak nik Vám do očí nehodí, že si kľudne môžete prezrieť zaheslované stránky. Dosť bolo teórie poďme na to.

Príklady z praxe
Erotické stránky a stránky chránené systémom .htaccess
Hodne erotických stránok využíva systém prihlasovania cez .htaccess. Pre nezainteresovaných to nie je dôležité, píšem to skôr ľuďom, ktorí vedia o čom to je. Takže ak chcete zistiť napríklad prístup k erotickej stránke, stačí ak do googlu zadáte nasledovný reťazec.

"http://*:*@deluxepass.com" admin:admin

Čo tento reťazec znamená? V podstate asi toľko, že v úvodzovkách zadaný text je text, ktorý sa dopĺňa textom za nimi. Keď žiadny nezadáte, bude sa hľadať akýkoľvek reťazec, ktorý bude zodpovedať pravidlu, v tomto prípade stručne povedané: Hľadaj na stránky deluxepass.com s akýmkoľvek reťazcom pred @ s parametrom admin:admin. Ako som povedal pred chvíľkou, ak tam parameter nepridáte, google bude hľadať akýkoľvek odpovedajúci reťazec a tak sa môžete dostať napríklad na ruské stránky, kde je týchto hesiel neúrekom. Aby ma nik neobvinil, že on nič nenašiel, tu je príklad:

http://www.lostcoders.net/posts-p16065.htm

Heslá “na objednávku”
Ďalším z príkladov, ktoré tu uverejním sú heslá tzv. na objednávku. Jednoducho množstvo stránok funguje tak, že si heslá ukladajú do priečinkov na servery a tak je ich jednoduché odhaliť. V podstate Vám tento riešenie zobrazí logy a iné informácie generované stránkami. Jedinou chybou je, že pornografické stránky majú schválne pomenované súbory, ktoré zodpovedajú vyhľadávaciemu reťazcu a tak po Vašom otvorení Vás zavalí pornografický materiál. Radšej si dopredu skontrolujte, či stránky nenesú názov pornografickej stránky, alebo si to rovno overte.

inurl:password intitle:index-of

Čo znamená tento reťazec? Prvá časť znamená, že má google hľadať slovo password v url. Druhá časť zabezpečuje že to bude priečinok, do ktorého je prístup, teda miesto na servery, kde sa môžete dostať aj vy cez http a nie len cez ftp.

SQL chyba (sql error)
Google dokáže zaindexovať aj chybu SQL servera, ktorý v danej chvíli vyhodí chybu. Týmto spôsobom sa dá zistiť meno a heslo k databáze. Nevýhodou pre programátorov je pamäť, ktorú google má a ktorá Vám zobrazí stránku v danom okamžiku jeho indexácie. Väčšinu ľudí ani nenapadne po odstránení chyby toto heslo zmeniť a tu je miestečko pre Vás. Môžete kľudne získať akékoľvek informácie z veľmi veľkých stránok a narobiť aj veľa škody. Preto by som Vás chcel vyzvať k zodpovednosti, tento článok neslúži k deštrukcii alebo osobnému obohateniu, skôr ako zaujímavosť v stále jedno tvárnejšom živote. Reťazec bude vyzerať nasledovne:

"access denied for user" "using password"

Čo znamená tento reťazec? V jednoduchosti je to chybová hláška, ktorú vráti SQL server pri chybe.

Nájdite si svoj rellease
V tejto sekcii by som Vám chcel ukázať, aké jednoduché je nájsť napríklad kompletný Windows v celom balíku. Ale to nie je jediná možnosť. Existuje ich veľmi veľké množstvo, mnoho obmien a podobne. Asi teraz neviete o čom hovorím a preto Vám najskôr ukážem reťazec, ktorý zabezpečí vyhľadávanie balíka.

inurl:microsoft filetype:iso

Opäť známy parameter. Takže prvá časť prehľadá url či sa v nej nenachádza slovo microsoft. Len čo toto slovo objaví, hľadá automaticky typ zabezpečený druhou frázou a ten je teraz definovaný ako iso. Iso je kompletný balík, teda image cédečka a podobne. Je však množstvo možností, ako a aký balík získať. V url môžete hľadať aj iné slová ako napríklad adobe, cad, oracle, pinnacle a podobne. Typ súboru je samozrejme tiež len na Vás, ak sa rozhodnete že bude .zip tak bude .zip. Je veľa typov .rar, .ace, .iso, .cue, .bin, .tar.gz, .gz, .mdf atď.

FrontPage heslá
Tento “fantastický” program využíva aj v tejto dobe hodne veľa ľudí a tak je ešte stále možné nájsť heslá, ktoré vytvoril. Google dokáže aj krásne filtrovať výsledok, čiže výstup bude už len čistý text meno heslo. Reťazec bude vyzerať takto.

ext:pwd inurl:(service | authors | administrators | users) "# -FrontPage-"

Ak si prezriete reťazec zistíte, že záujem máme len o súbor pwd a prehľadávame url ktorá obsahuje slová service, authors, administrators, users a hľadáme len typ FrontPage.

Citlivé súbory
Google Vám môže vyhľadať aj takzvané citlivé súbory, medzi ktoré by som napríklad zaradil logy a podobne. Tu je zoznam súborov, ktoré môžu znamenať bezpečnostné riziko. Pamätajte, že stránky sa vyvíjajú, menia a tak je dobre prehľadávať skôr pamäť samotného googla. Reťazec bude vyzerať nasledovne.

intitle:"Index of" _vti_inf.html

Ako sme si už pred tým povedali, prvá časť nám zabezpečí zobrazenie len výpisu a prístupu k priečinku webu, druhá vyhľadáva jednotlivé súbory. Ich zoznam tých asi najpodstatnejších nájdete tu.

_vti_inf.html, service.pwd, users.pwd, authors.pwd, administrators.pwd, shtml.dll, shtml.exe, fpcount.exe, default.asp, showcode.asp, sendmail.cfm, getFile.cfm, imagemap.exe, test.bat, msadcs.dll, htimage.exe, counter.exe, browser.inc, hello.bat, dvwssr.dll, cart32.exe, add.exe, index.JSP, index.jsp, SessionServlet, shtml.dll, index.cfm, page.cfm, web_store.cgi, shop.cgi, upload.asp, default.asp, pbserver.dll, phf, test-cgi, finger, Count.cgi, php.cgi, php, nph-test-cgi, handler, webdist.cgi, webgais, websendmail, faxsurvey, htmlscript, perl.exe, wwwboard.pl, www-sql, view-source, campas, aglimpse, glimpse, man.sh, AT-admin.cgi, AT-generate.cgi, filemail.pl, maillist.pl, info2www, files.pl, bnbform.cgi, survey.cgi, classifieds.cgi, wrap, cgiwrap, edit.pl, perl, names.nsf, webgais, dumpenv.pl, test.cgi, submit.cgi, guestbook.cgi, guestbook.pl, cachemgr.cgi, responder.cgi, perlshop.cgi, query, w3-msql, plusmail, htsearch, infosrch.cgi, publisher, ultraboard.cgi, db.cgi, formmail.cgi, allmanage.pl, ssi, adpassword.txt, redirect.cgi, f, cvsweb.cgi, login.JSP, login.jsp, dbconnect.inc, admin, htgrep, wais.pl, amadmin.pl, subscribe.pl, news.cgi, auctionweaver.pl, .htpasswd, acid_main.php, access_log, access-log, access.log, log.htm, log.html, log.txt, logfile, logfile.htm, logfile.html, logfile.txt, logger.html, stat.htm, stats.htm, stats.html, stats.txt, webaccess.htm, wwwstats.html, source.asp, perl, mailto.cgi, YaBB.pl, mailform.pl, cached_feed.cgi, cr, global.cgi, Search.pl, build.cgi, common.php, common.php, show, global.inc, ad.cgi, WSFTP.LOG, index.html~, index.php~, index.html.bak, index.php.bak, print.cgi, register.cgi, webdriver, bbs_forum.cgi, mysql.class, sendmail.inc, CrazyWWWBoard.cgi, search.pl, way-board.cgi, webpage.cgi, pwd.dat, adcycle, post-query, help.cgi

Možno sa Vám bude zdať zoznam pridlhý, ale povedal by som že je prikrátky. Súborov, ktoré môžu vážne ohroziť Vášho webu.

Heslá v súbore
Ak sa Vám ešte nemálilo, ukážem Vám ako nájsť aj heslá v textovom súbore uložené niekde na servery. Zápis bude nasledovný.

inurl:passlist.txt

Myslím, že tu ani nie je čo vysvetľovať. Ak by ste hľadali iný typ, html alebo napríklad php zameňte ho. Rovnako aj názov súboru môžete zameniť.

Overovacie súbory
Nad týmto názvom som polemizoval asi hodinu, tak ma prosím nezbite. Ide o súbor, kde sa do textového súboru zapisujú údaje o užívateľoch, čo používa napríklad DCForum a DCShop. Tu sa naskytá otázka, či je vôbec možné, aby firma ktorá ponúka elektronický obchod môže vôbec takto triviálne zapisovať dáta. Ale to je na inú diskusiu. Zápis bude nasledovný.

allinurl:auth_user_file.txt

Význame je asi taký, že hľadáte v celej url dostupné práve tento jeden textový súbor. Skoro som z nôh spadol, keď som objavil tento súbor. Upozorňujem že je z pamäte googla.

Link bohužiaľ za tú dobu zmenil obsah, je jasné že google cache nie je nekonečná, takže ho nemá vôbec význam sem pridať, určite nájdete množstvo iných

Hry, filmy, hudba a iné
Aj toto sa dá pomocou googla nájsť. Zápis je veľmi jednoduchý.

"parent directory " /appz/ -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " DVDRip -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " Xvid -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " Gamez -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " MP3 -xxx -html -htm -php -shtml -opendivx -md5 -md5sums
"parent directory " Meno speváka alebo skupiny -xxx -html -htm -php -shtml -opendivx -md5 -md5sums

Ak sa pozriete na zápis, zistíte že sa dá ľahko vyhľadať akákoľvek vec na googli.

Hudba
Vyhradil som si pre tuto špecialitku jednu kategóriu. Po zadaní jednoduchého reťazca do googla môžete nájsť celé albumy spevákov, skupín a pod. Ak niečo hľadáte, zadajte tento reťazec.

?intitle:index.of? mp3

Znamená asi toľko, že hľadáte v priečinku vami zobraziteľnom súbor končiaci na mp3. Ak pridáte aj speváka, tak výsledok bude ešte viac presný. Príkladom ?intitle:index.of? mp3 jackson nájdete množstvo z jeho albumov, ja som klikol hneď na prvý odkaz a lala

Link bohužiaľ za tú dobu zmenil obsah, je jasné že google cache nie je nekonečná, takže ho nemá vôbec význam sem pridať, určite nájdete množstvo iných

Zhodnotenie a záver
Myslím, že je to nadnes už aj dosť. Dúfam, že som Vás týmto článkom zaujal a že sa stane Vaším obľúbeným. Chcem Vás však poprosiť o niekoľko vecí. Všetky informácie používajte s mierou a hlavne pre svoje osobné účely. Prosím nevyužívajte ich pre prospech svoj alebo iných osôb. Ďalej dúfam, že článok nevyvolá histériu a že nebude polovica návštevníkov inet.sk vyhľadávať tieto informácie. Článok vznikol hlavne pre upozornenie bezpečnostných chýb a lenivosti administrátorov.

Ak by mal tento článok u Vás úspech, môžem sa pozrieť aj na ďalšie možnosti využitia internetových nástrojov.

Článok bol publikovaný dňa 28. mája 2005 na portály inet.sk a stal sa okamžite hitom portálu.

Zaujal vás článok? Sledujte ma na Twitteri.


4 Responses to “Čo všetko môžete získať pomocou googlu”


  1. 1 Midnite Dec 9th, 2007 at 10:26

    Super článok, fakt.. Ja len doplním, že tá hudba sa pomocou googlu presne hľadá takto:

    http://www.midnite.yw.sk/?p=13

  2. 2 oooo Dec 9th, 2007 at 14:24

    midnite dakujem za komentar, ked sa pozries, clanok je hodne stary, vela veci sa odvtedy zmenilo, doplnolo, odhalilo. len som si chcel sem dostat par clanockov ku ktorym mam emocny vztah, teda znamenali pre mna nieco v dobe ked som ich pisal

  1. 1 Pozor na XSS zraniteľnosť v tisícoch flashových súborov Pingback on Dec 3rd, 2008 at 05:10
  2. 2 Google predstavil generátor robots.txt Pingback on Jan 22nd, 2009 at 19:19

Zanechajte odkaz

  • na ďalšie komentáre odkazujte za použitia čísla komentáru v hranatej zátvorke, napríklad [3]
  • vaša IP adresa je logovaná a zneužívaná na výskumné účely
  • môžete mi tykať
  • komentáre sú moderované, kritiku prijímam, snažte sa prosím strániť invektív