Interesting spots
První zkušenosti s počítáním důležitosti článků podle počtu kliknutí jsou (přinejmenším) zajímavé.
Před týdnem jsem uvolnil novou verzi algoritmu výpočtu a-ranku, tedy důležitosti článku. Do důležitosti započítává kolik lidí na něj kliklo a jak je článek starý.
Původně zamýšlený poměr f(počet kliků)/stáří se neukázal nijak zvlášť dobrý, takže jsem nakonec stáří trochu zlogaritmoval, a to už dává docela slušné výsledky.
Zajímavé je, na jaké články se nejvíc kliká. Bulvár, bulvár, bulvár, ceny telefonů, bulvár. No ale nejsme tu od toho, abychom své čtenáře vychovávali, že. Koláče jsou koláče, takže dobrou chuť, pokud zrovna obědváte.
V říjnu 2004 v Brně budu na konferenci Datakon prezentovat Přehled.net.
Přehled.net je založen na algoritmech umělé inteligence, konkrétně text-miningu a strojového učení. Dobře známé základní algoritmy byly výrazně rozšířeny a upraveny, protože Přehled.net má jisté specifické vlastnosti a požadavky, pro které jsou běžně používané algoritmy příliš obecné.
Článek popisující, jak Přehled.net funguje, byl recenzenty ohodnocen velmi kladně, z čehož mám pochopitelně velkou radost.
Ještě musím ověřit, jak je to s copyrightem, a pokud by s tím nenastaly žádné komplikace, zveřejním tu reprint.
Rekompilace proběhla úspěšně, a tak jsem rovnou upgradoval na 0.9.5beta, což znamená:
Přii výpočtu důležitosti článku se bere v úvahu i jeho stáří a počet kliknutí na článek. Pokud na článek nikdo nekliká, tak se brzy propadne někam dolů, kde už ho nikdo nenajde, a tedy na něj už ani nikdo neklikne — je to takové dvojsečné.
Přehled.net dočasně nejede, protože je špatně zkompilované PHP, ale snad to brzy nahodíme...