2010. február 19., péntek

Hóhérakasztó

Todomap integrációs körök, bevetésen a wireshark.

Tegnap este összekalapáltam egy java API-t arra, hogy a magyarország.hu hivatalkeresőjéből kiturkálja egy település polgármesteri hivatalának elérhetőségeit. Szóval kicsit a saját főztömet kellett megennem, bár nem én csináltam a keresőt. Viszont ráment az egész estém, furcsa dolgokon kellett átverekednem magam. A hivatalkeresőt egyáltalán nem úgy tervezték, hogy emberi felhasználón kívül bárki is hozzányúljon.
  • Ha elötte nem jön létre a session és emiatt nincsen cookie-d, akkor nem működik a kereső. Innentől már sima URLConnection osztállyal sem sikerült elboldogulni, be kellett rángatni egy commons-httpclient-et.
  • Az irányítószámot körülbelül le is lehetne szedni az egészről, teljesen figyelmen kívül hagyja. Például ha azt mondod, hogy Sopron polgármesteri hivatalát keresed, és arra a Sopronra gondolsz, amelynek irányítószáma 9400, akkor még rákérdez hogy nem Sopronkövesdre gondoltál-e, aminek már 9483 az irányítószáma.
  • És az ilyen találgatásoknál úgy tűnik a szerver oldalon hagyja hogy mit kerestem, mert azt nem kell újra elpostolni.
  • Néha a szerver nem elérhető. Remélem nem csináltam valami rosszat, végülis csak http requesteket küldök.
  • Néhány városnál igazán mókás adatok is lejönnek, mindenféle freemailes, t-emailes, monornetes, email címek. Minden hivatal onnan szerzi az "informatikai megoldásait", ahonnan éppen tudja. Kiváncsi vagyok mennyire lesz ez hatékony módszer az integrációra, biztosan van közte néhány döglött cím is.