Ahogy ígértem, jöjjön egy újabb interjú, most a miner.hu
tulajával és egyik fejlesztőjével, Bártházi Andrással. És az interjú mellett
ajánlom figyelmetekbe a webizen.hu-t is.
Mióta létezik az oldal, milyen céllal hoztátok létre?
A legelső változat az oldalból augusztus 8-án került fel a webre, másnap el is indult publikusan is. Az oldal egy másik fejlesztésünk mellékterméke (természetesen ma már nem melléktermékként tekintünk rá), egy szerver oldali RSS feldolgozón dolgoztunk, és ennek kapcsán készült el maga az oldal is. Egy hasonló szolgáltatást már régóta terveztem, mivel érdekel a hazai blogkínálat, trendek, s hogy ki miről, hogyan és miért ír. Ennek elemzésére, de például konkrétan a miner.hu és más szolgáltatások bloggerekben lecsapódó reakcióinak megtalálására a szolgáltatás kiválóan alkalmas.
A szolgáltatáshoz a blog augusztus 27-n indult be.
Hány blogban és bejegyzésben keres a miner.hu?
Jelenleg 67380 blogban, és büszkén jelentem, 1.500.107 bejegyzésben, vagyis az imént léptük át a másfél milliós határt. A blogok számához egy gondolatot érdemes hozzátenni: nincs 67380 aktív blog ma Magyarországon, és a létező, még aktív bloggerek közül is sokan vannak, akik viszonylag ritkábban ejtenek bejegyzést. A blogok száma a megfigyelt blogokat jelenti, ha valaki ír egy bejegyzést régóta elhagyott, vagy létrejött, de még üres blogjába, akkor mi azt követni tudjuk ilyenkor is.
Ebből a hatalmas számból, hány blogger számít aktívnak?
Az aktív bloggerek számánál meghatározandó, hogy kit hívunk aktív bloggernek. Az egyszerűség kedvéért azoknak a bloggereknek a száma, akikről a Miner.hu tud, és az utóbbi egy héten bejegyzést tettek, 6120. Naponta jellemzően 5000-6000 bejegyzés születik.
Sok hellyel ellentétben, ha jól tudom, hozzátok automatikusan bekerül minden blog, nincs regisztráció. Miért így oldottátok meg?
Van regisztráció, pontosabban szívesen vesszük, ha valaki jelzi számunkra még be nem került blogját. Ilyen jelzésből napi 5-10 van folyamatosan. Erre beüzemeltünk régebben egy formot is, ez átmenetileg lekerült a designváltás kapcsán, amint lesz rá időnk, visszaállítjuk ezt a funkciót is (de addig is lehet nekünk levelet írni!).
Az automatikus bekerülés mellett több okból döntöttünk. Egyrészt egyszerű megfigyelés: általam ismert blogkeresők egyetlen kivétellel tudtommal mind így működnek. Ennek persze megvan a gyakorlatias oka, így tudjuk és tudják a legjobb szolgáltatást nyújtani. A blogger társadalomtól nem várható el, hogy beregisztráljon, mindig lesz olyan, aki számára új maga a blogolás, a Miner.hu-ról pedig még végképp nem is hallott. Azt azért megjegyezném, hogy a bekerülés nem teljesen automatikus folyamat. Több robotunk pásztázza a netet RSS-ek után kutatva, melyeket aztán be tudunk venni a keresett tartalmak közé, ezek azonban nagyon sokkmindent találnak. A talált RSS-eket jelen pillanatban mind típus (blog jellegű-e?), mind pedig nyelv (magyar nyelvű bejegyzéseket tartalmaz-e?) szerint kézzel kategorizáljuk, így összeállítva a lehető legjobb listát. Ezt a külföldi blogszolgáltatók nem tudják megtenni, így például egy Google Blogsearch-höz képest a célzásban (minél több magyar, blog típusú bejegyzés) nagyságrendileg jobban teljesítünk.
Hogy működnek ezek a robotok, az internet mely részeit pásztázzak?
A konkrétumokról nem szeretnék mesélni, mivel ezek üzleti titok részét képezik. Jelenleg csak a magyar webet pásztázzuk, de rövidesen a teljes webre is ki fogjuk terjeszteni a robot működését.
Együttműködtök a nagyobb blogszolgáltatókkal?
Amennyire hajlandóak rá, igen. Van, aki egyszerűen nem reagál a megkeresésünkre, és van olyan is, akivel teljesen jó kapcsolatot sikerült felépítenünk. Sajnos néhány blogszolgáltatónál előfordul az is, hogy nincs vagy hibás az RSS, rájuk próbálunk hatni, néha sikerrel. Azt viszont ekértük, hogy ha nem sikerül kialakítani kapcsolatot egy blogszolgáltatóval, attól még a keresőnkben szerepelnek.
A kereséseknél alkalmaztok ti is valami blogrankféleseget? Vagy csak simán a szavakra kerestek?
Nem, mert egyszerűen nincs értelme. Lehet, hogy ez egy kicsit erős kijelentés így, de ha végiggondolja az ember, szerintem teljesen egyértelmű. A pageranket a Google azért vezette be, mert túl sok találat volt, melyek akár érdektelennek is bizonyulhattak, főként, ha első helyen szerepeltek. Egy blogkeresőnél azonban teljesen más okból keresnek az emberek, míg egy webkeresőnél a találatok mennyisége miatt nem lehet cél (és nem is érdekel senkit), hogy minden találatot végignézzen az ember, egy blogkeresőnél viszont igenis ez lehet a cél, hiszen bizonyos témakört szeretnék vele monitorozni. A magyar blogok nem szoktak tömegesen egy adott témáról írni, nem kell kiválogatni a legérdekesebbet, legértékesebbet. Ha viszont folyamatosan figyelem, hogy mi jön be például a "miner.hu"-ra, akkor engem kifejezetten az fog érdekelni, hogy mi új.
Egy másik gondolat ennek kapcsán, hogy egy blogot egyszerűen nem lehet értékelni. A gondolatok, vélemények számítanak, valakinek a megmondós bloggerek az érdekesek, valakinek pedig a visszafogottabban, megfontoltabban írók.
Ennek ellenére nem zárom ki, hogy nem lesz valami blogrank lehetőség, de jelen pillanatban még senki sem tudott nekem még olyan use-case-t mondani, ahol szerepe lehetne.
Ez elég kemény munkának tűnik, mennyi időt vesz igénybe a szortírozás?
Elég sokat (heti 3-4 óra), de megéri. Van rá egy admin felületünk, ahol hatékonyan át lehet verekednie magát az embernek a listán, persze így is van teendő vele.
Milyen technológiákat alkalmaztatok az oldal elkészítésénél?
Perl (robotok), PHP (kiszolgálóoldal és néhány robot), MySQL (indexelendő bejegyzések tárolása), plusz egy egyedi technológia a keresésre magára.
Mik voltak a legnehezebben megoldható problémák?
Az indexelés és a keresés, ezek ilyen számoknál kifejezetten húzós feladatot jelentenek. Az elején, mikor 300 blogot figyeltünk, minden szép és jó volt, ment a keresés, mint a karikacsapás. A MySQL beépített full text search megoldását használtuk, amivel alapból is voltak gondok, de lényegében szépen működött. Aztán ott kezdődött el a probléma, amikor annyi bejegyzés kezdett el jönni, amit a MySQL nem tudott lekezelni: lassabban tudta csak hozzáadni a bejegyzést, mint jött egy új. Ez nem csak a bekerülést, de a lekérdezéseket is megakasztotta. Ekkor jött pár kész kereső megoldás a képbe, átmenetileg használtuk a Mnogosearch-öt is, s egy ideig megint jó volt a helyzet. Végül most kellett megint egy igen komoly átalakítást megtennünk, mert egymillió bejegyzés fölé érve megint belassult a keresés. Hétfőn új szerverre került a miner.hu, s egy megfelelően optimalizált keresőmotort állítottunk be hozzá. Ez reményeink szerint a 10.000.000 bejegyzést is le fogja kezelni gond nélkül, és most már tényleg a további szolgáltatásokra fogunk tudni majd koncentrálni, a sebesség kipipálható, azt hiszem.
És a bónusz kérdés: Szerinted a miner.hu web 2-es oldal?
A fejlesztési modelljét, a szolgáltatás lényegét tekintve: igen. Bár maga az oldal nem közösségi, és a szó hagyományos értelmében nem is szeretnénk azzá tenni, de a magyar nyelvű blogger közösség által előállított tartalmat teszi új módon elérhetővé, és ezáltal a Web 2.0 kategóriába szerintem nyugodtan besorolható. Természetesen egyáltalán nem a címke a lényeg, hanem hogy jól és hatékonyan működjön a szolgáltatás.

Köszönöm a meginterjúvolást! ;)
En is a valaszokat! :)
6120 aktív blogger! Mintha a piackutatók (és a blogszolgáltatók) nagyobb számról beszélnének:-)
[nekem valahogy inkább ez tűnik reálisnak...]
Én mit köszönjek meg? Mondjuk azt, hogy elolvashattam ezt az interjút. :) Köszönöm.
Na, közben azt is megleltem, hogy mire lenne mégiscsak jó az a blogrank. :) De erről majd kicsit később.
Kivancsian varom a fejlemenyeket :)
Erre lenne jó:
blog.miner.hu/2006/12/19/blogszemlehu-mini-google-news-a-miner-api-ra-epitve/
Míg a miner.hu oldalon teljesen jó lehet az időrendi sorrend, a blogszemle.hu-ra jó lenne egy kis súlyozás. Persze lehet majd még fejleszteni a dolgot, de valamilyen megoldás mindenképpen kell, ha lesz érdeklődés egy ilyen jellegű blogszemlére.
Klassz, nekem tetszik.
Szerintem is jó ez a BLOG és úgy látom egyre népszerűbb ;)
A szövegben nem lehet HTML-t használni, a linkeket pedig automatikusan aláhúzzuk. Az email cím megadása kötelező, de az oldalon nem jelenik meg. Ha van buzz-os felhasználóneved, itt bejelentkezhetsz.
Webfejlesztés & sok más
RSS
balinto 2006