<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>OSnews.pl &#187; rekomendacje</title>
	<atom:link href="http://osnews.pl/tag/rekomendacje/feed/" rel="self" type="application/rss+xml" />
	<link>http://osnews.pl</link>
	<description>Obywatelski Serwis Niusów IT</description>
	<lastBuildDate>Thu, 24 May 2012 14:36:56 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.2</generator>
		<item>
		<title>Google stworzył Hotpot &#8211; rekomendacje miejsc</title>
		<link>http://osnews.pl/google-stworzyl-hotpot-rekomendacje-miejsc/</link>
		<comments>http://osnews.pl/google-stworzyl-hotpot-rekomendacje-miejsc/#comments</comments>
		<pubDate>Tue, 16 Nov 2010 16:59:10 +0000</pubDate>
		<dc:creator>michuk</dc:creator>
				<category><![CDATA[Newsy]]></category>
		<category><![CDATA[google]]></category>
		<category><![CDATA[hotpot]]></category>
		<category><![CDATA[internet]]></category>
		<category><![CDATA[rekomendacje]]></category>

		<guid isPermaLink="false">http://osnews.pl/google-stworzyl-hotspot-rekomendacje-miejsc/</guid>
		<description><![CDATA[Google idzie śladem wytyczonym przez Foursquare i ostatnio Facebooka i tworzy system oceniania i rekomendacji lokalnych atrakcji: restauracji, barów, kafejek i zapewne w przyszłości innych obiektów. Dzięki nowej usłudze (zintegrowanej z innymi produktami Google jak Places, Latitude czy Maps) możemy ocenić miejsca, które często odwiedzamy, sprawdzić jak oceniają i komentują je inni, w obietnicy dostając [...]]]></description>
			<content:encoded><![CDATA[<p>Google idzie śladem wytyczonym przez Foursquare i ostatnio Facebooka i tworzy system oceniania i rekomendacji lokalnych atrakcji: restauracji, barów, kafejek i zapewne w przyszłości innych obiektów.</p>
<p><!--header--><span id="more-202652"></span>
<p>Dzięki nowej usłudze (zintegrowanej z innymi produktami Google jak Places, Latitude czy Maps) możemy ocenić miejsca, które często odwiedzamy, sprawdzić jak oceniają i komentują je inni, w obietnicy dostając spersonalizowane rekomendacje w skali globalnej &#8212; Google podpowie nam gdzie powinniśmy się stołować, gdziekolwiek nas poniesie. Sugestie te dostępne będą przy <a href="http://googleblog.blogspot.com/2010/10/place-search-faster-easier-way-to-find.html" class="extlink">przeszukiwaniu Google Places</a>.</p>
<p><a href="http://img200.imageshack.us/img200/7610/zrzutekranugooglehotpot.png" ><img src="http://img574.imageshack.us/img574/7610/zrzutekranugooglehotpot.png" /></a></p>
<p>Hotpot dostępny jest jako usługa www oraz aplikacja Androida. Wersja na iPhone ma się pojawić wkrótce.</p>
<p>Przed chwilą jeszcze na stronie <a href="http://www.google.com/hotpot" class="extlink">www.google.com/hotpot</a> można było znaleźć komunikat, że serwis nie jest dostępny w Polsce, ale firma zachęca do skorzystania z <a href="http://www.google.com/hotpot?hl=en" class="extlink">wersji anglojęzycznej</a>. Ta wersja jednak przekierowywała pod każdym łączem na niedziałającą wersję polską i zapewne dlatego zdecydowano się ją wyłączyć.</p>
<div id="fb-root"></div><script src="http://connect.facebook.net/en_US/all.js#xfbml=1"></script><!-- Do not remove -->]]></content:encoded>
			<wfw:commentRss>http://osnews.pl/google-stworzyl-hotpot-rekomendacje-miejsc/feed/</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>LubimyCzytać poleca książki otwartym algorytmem Filmastera</title>
		<link>http://osnews.pl/lubimyczytac-poleca-ksiazki-otwartym-algorytmem-filmastera/</link>
		<comments>http://osnews.pl/lubimyczytac-poleca-ksiazki-otwartym-algorytmem-filmastera/#comments</comments>
		<pubDate>Mon, 27 Sep 2010 19:26:39 +0000</pubDate>
		<dc:creator>michuk</dc:creator>
				<category><![CDATA[Newsy]]></category>
		<category><![CDATA[AGPL]]></category>
		<category><![CDATA[filmaster]]></category>
		<category><![CDATA[gpl]]></category>
		<category><![CDATA[lubimyczytac]]></category>
		<category><![CDATA[open-source]]></category>
		<category><![CDATA[programowanie]]></category>
		<category><![CDATA[rekomendacje]]></category>

		<guid isPermaLink="false">http://osnews.pl/lubimyczytac-poleca-ksiazki-otwartym-algorytmem-filmastera/</guid>
		<description><![CDATA[Serwis dla miłośników książek LubimyCzytać.pl wdrożył otwarty algorytm rekomendacji stworzony pierwotnie na potrzeby serwisu filmowego Filmaster.pl. Dzięki temu również bibliofile mogą teraz skorzystać z uroków spersonalizowanych sugestii, funkcji tak chwalonej przez kinomanów korzystających z Filmastera. Wdrożenie było możliwe, gdyż algorytm stworzony przez zespół Filmastera opublikowany jest na licencji Affero GPLv3. Oznacza, że każdy może go [...]]]></description>
			<content:encoded><![CDATA[<p>Serwis dla miłośników książek <a href="http://lubimyczytac.pl" class="extlink">LubimyCzytać.pl</a> wdrożył otwarty algorytm rekomendacji stworzony pierwotnie na potrzeby serwisu filmowego <a href="http://filmaster.pl" class="extlink">Filmaster.pl</a>. Dzięki temu również bibliofile mogą teraz skorzystać z uroków spersonalizowanych sugestii, funkcji tak chwalonej przez kinomanów korzystających z Filmastera.</p>
<p><!--header--><span id="more-187342"></span>
<p>Wdrożenie było możliwe, gdyż algorytm stworzony przez zespół Filmastera opublikowany jest na licencji <a href="http://www.gnu.org/licenses/agpl-3.0.html" class="extlink">Affero GPLv3</a>. Oznacza, że każdy może go wykorzystać w swoim projekcie, o ile wszelkie zmiany i poprawki udostępni publicznie na tej samej licencji.</p>
<p>To własnie potęga otwartości! Dobre rozwiązania, stworzone na potrzeby jednego projektu, szybko replikowane są w innych. Korzystają z tego wszyscy zainteresowani, gdyż algorytm unowocześniany przez kilka zespółów jednocześnie dąży do doskonałości szybciej niż ma to miejsce w przypadku zamkniętych, chronionych pod kluczem rozwiązań.</p>
<p>Marcin Szajda, twórca LubimyCzytać.pl, chwali wdrożenie:</p>
<blockquote><p>Od dłuższego czasu poszukiwaliśmy rozwiązania, które na podstawie ocen użytkowników pozwoliłoby nam z dużą precyzją sugerować im książki warte przeczytania. Wybór padł na <a href="http://filmaster.org/display/DEV/New+recommendation+engine" class="extlink">silnik rekomendacji Filmastera</a>. Nowy silnik rekomendacji działa w serwisie od kilku dni, a odzew społeczności jest bardzo pozytywny. Każdy użytkownik, który ocenił w serwisie co najmniej 20 książek, otrzymuje codziennie aktualizowaną, pokategoryzowaną listę książek. Sam silnik nie jest trudny do wdrożenia, działa szybko, sprawnie i co najważniejsze bardzo dobrze poleca książki. Skuteczność algorytmu mierzona pierwiastkiem z błędu średniokwadratowego jest w granicach <a href="http://pl.wikipedia.org/wiki/B%C5%82%C4%85d_%C5%9Bredniokwadratowy" class="extlink">RMSE</a>=0.88.</p>
<p>Jesteśmy bardzo zadowoleni z wdrożenia algorytmu rekomendacji Filmastera.</p></blockquote>
<p>Autorem algorytmu rekomendacji jest <strong>Jakub Tlałka</strong>. Jego prezentację z Auli Polskiej można obejrzeć na stronie konferencji: <a href="http://aulapolska.pl/wystapienia/aula-52/filmaster---komputerowe-wrozbiarstwo-czyli-jak-poprawic-wyniki-silnika-rekomendacji-o-2" class="extlink">Filmaster &#8211; komputerowe wróżbiarstwo czyli jak poprawić wyniki silnika rekomendacji o 20%?</a> W miniony weeken Jakub na <a href="http://www.jesien.org/2010/agenda" class="extlink">Jesieni Linuksowej</a> w Ustroniu Jaszowcu, wygłosił również referat na temat rekomendacji, gdzie opowiedział m.in. o sposobach poprawiania skuteczności algorytmu. Wideo z tej prezentacji nie jest jeszcze dostępne.</p>
<p>Szczegółowo o algorytmie rekomendacji poczytać można na wiki projektu Filmaster: <a href="http://filmaster.org/display/DEV/New+recommendation+engine" class="extlink">New recommendation engine</a>, a na bitbuckecie ściągnąć można <a href="http://bitbucket.org/filmaster/filmaster-test/src/tip/count_recommendations.cpp" class="extlink">otwarty kod algorytmu</a>.</p>
<div id="fb-root"></div><script src="http://connect.facebook.net/en_US/all.js#xfbml=1"></script><!-- Do not remove -->]]></content:encoded>
			<wfw:commentRss>http://osnews.pl/lubimyczytac-poleca-ksiazki-otwartym-algorytmem-filmastera/feed/</wfw:commentRss>
		<slash:comments>65</slash:comments>
		</item>
		<item>
		<title>Otwarty silnik rekomendacji filmów</title>
		<link>http://osnews.pl/otwarty-silnik-rekomendacji-filmow/</link>
		<comments>http://osnews.pl/otwarty-silnik-rekomendacji-filmow/#comments</comments>
		<pubDate>Wed, 05 May 2010 14:30:31 +0000</pubDate>
		<dc:creator>michuk</dc:creator>
				<category><![CDATA[Newsy]]></category>
		<category><![CDATA[AGPL]]></category>
		<category><![CDATA[algorytmy]]></category>
		<category><![CDATA[filmaster]]></category>
		<category><![CDATA[open-source]]></category>
		<category><![CDATA[rekomendacje]]></category>
		<category><![CDATA[web20]]></category>

		<guid isPermaLink="false">http://osnews.pl/otwarty-silnik-rekomendacji-filmow/</guid>
		<description><![CDATA[Od kilku dni rekomendacje filmów w społecznościowym serwisie Filmaster generuje nowy algorytm dostępny na licencji AGPLv3. Nowy silnik rekomendacji serwisu stworzony został w oparciu o dobre praktyki wypracowane przez programistów pracujących nad rozwiązaniem konkursu Netflix (zwiększenie o 10% celności filmowych rekomendacji). Trafność rekomendacji nowego algorytmu Filmastera wyliczona za pomocą testu silników rekomendacji, jest prawie 20% [...]]]></description>
			<content:encoded><![CDATA[<p>Od kilku dni <a href="http://filmaster.pl/rekomendacje/" class="extlink">rekomendacje filmów</a> w społecznościowym serwisie <a href="http://filmaster.pl" class="extlink">Filmaster</a> generuje nowy algorytm dostępny na licencji AGPLv3.</p>
<p><!--header--><span id="more-134612"></span>
<p>Nowy silnik rekomendacji serwisu stworzony został w oparciu o dobre praktyki wypracowane przez programistów pracujących nad rozwiązaniem <a href="http://osnews.pl/milion-dolarow-za-rozszyfrowanie-filmowych-gustow/" class="extlink">konkursu Netflix</a> (zwiększenie o 10% celności filmowych rekomendacji).<br />
Trafność rekomendacji nowego algorytmu Filmastera wyliczona za pomocą <a href="http://jira.filmaster.org/browse/FLM-45" class="extlink">testu silników rekomendacji</a>, jest prawie 20% większa niż wcześniejszego algorytmu. Konkretnie, wartość <a href="http://en.wikipedia.org/wiki/Root_mean_squared_error" class="extlink">RMSE</a> wyliczona na podstawie około ćwierć miliona ocen wynosi:<br />
- 1,55 dla starego algorytmu<br />
- 1,30 dla nowego</p>
<p>Nowy algorytm pobiera dane dotyczące głosów z bazy danych, następnie przetwarza je generując rekomendacje, by ostatecznie nadpisać wcześniej wygenerowane rekomendacje w bazie. Pierwsza i ostatnia część jest oczywiście specyficzna dla Filmastera. Sam algorytm jednak, będący sercem silnika, jest całkowicie uniwersalny i może być wykorzystany w dowolnym projekcie open source.</p>
<p>Nad nowym algorytmem rekomendacji pracował <strong>Jakub Tlałka</strong>. W zeszłym roku licealista w Staszicu i <a href="http://www.staszic.waw.pl/uczniowie/sukcesy" class="extlink">finalista Olimpiady Matematycznej</a>, obecnie student pierwszego roku matematyki i informatyki Uniwersytetu Warszawskiego oraz dorywczo programista Filmastera.</p>
<p>Mimo że serwis Filmaster napisany jest w większości w Pythonie (framework django), silnik rekomendacji zaimplementowany został w C++ ze względu na większą wydajność. <a href="http://bitbucket.org/filmaster/filmaster-test/src/tip/count_recommendations.cpp" class="extlink">Kod nowego silnika</a> pobrać można z repozytorium. Podobnie jak <a href="http://osnews.pl/filmaster-wolnym-oprogramowaniem/" class="extlink">całość kodu Filmastera</a> dostępny jest on na licencji AGPLv3. </p>
<p>Szczegółowa dokumentacja techniczna nowego algorytmu znajduje się na wiki: <a href="http://filmaster.org/display/DEV/New+recommendation+engine" class="extlink">New recommendation engine</a>. Porównać ją można z <a href="http://filmaster.org/display/DEV/Recommendations+engine" class="extlink">wcześniejszym algorytmem</a> oraz z <a href="http://filmaster.org/display/DEV/Alternative+recommendation+engine" class="extlink">niezaimplementowanym pomysłem</a> na alternatywny algorytm rekomendacji.</p>
<p>Algorytm przetestować możecie oceniając co najmniej 20 filmów w <a href="http://filmaster.pl" class="extlink">serwisie Filmaster</a> (wymagane jest konto), a następnie przechodząc na stronę <a href="http://filmaster.pl/rekomendacje/" class="extlink">rekomendacji filmów</a>. Alternatywnie, możecie zaaplikować mechanizm rekomendacji na własnych danych. W przypadku sukcesów lub porażek, prosimy o komentarze.</p>
<div id="fb-root"></div><script src="http://connect.facebook.net/en_US/all.js#xfbml=1"></script><!-- Do not remove -->]]></content:encoded>
			<wfw:commentRss>http://osnews.pl/otwarty-silnik-rekomendacji-filmow/feed/</wfw:commentRss>
		<slash:comments>10</slash:comments>
		</item>
		<item>
		<title>Qizmt czyli MapReduce dla .NET od MySpace (i również open source!)</title>
		<link>http://osnews.pl/qizmt-czyli-hapoop-mapreduce-dla-net-od-myspace-i-rowniez-open-source/</link>
		<comments>http://osnews.pl/qizmt-czyli-hapoop-mapreduce-dla-net-od-myspace-i-rowniez-open-source/#comments</comments>
		<pubDate>Wed, 16 Sep 2009 17:03:00 +0000</pubDate>
		<dc:creator>michuk</dc:creator>
				<category><![CDATA[Newsy]]></category>
		<category><![CDATA[.net]]></category>
		<category><![CDATA[Hadoop]]></category>
		<category><![CDATA[MapReduce]]></category>
		<category><![CDATA[myspace]]></category>
		<category><![CDATA[open-source]]></category>
		<category><![CDATA[programowanie]]></category>
		<category><![CDATA[Qizmt]]></category>
		<category><![CDATA[rekomendacje]]></category>

		<guid isPermaLink="false">http://osnews.pl/qizmt-czyli-hapoop-mapreduce-dla-net-od-myspace-i-rowniez-open-source/</guid>
		<description><![CDATA[Otwieranie kodu swoich wewnętrznych frameworków stało się modne. Najpierw Facebook otworzył Tornado, teraz MySpace &#8212; nie chcąc być gorszym &#8212; pokazał światu kod Qizmt, czyli frameworku MapReduce dla .NET. Jak tłumaczą deweloperzy MySpace: Środowiska MapReduce stosowane są przez serwisy przetwarzające jednocześnie ogromne ilości danych, takie jak strony Google czy Amazon. Podobnie w MySpace, miliony użytkowników [...]]]></description>
			<content:encoded><![CDATA[<p>Otwieranie kodu swoich wewnętrznych frameworków stało się modne. Najpierw <a href="http://osnews.pl/framework-zasilajacy-friendfeed-wydany-jako-open-source/" class="extlink">Facebook otworzył Tornado</a>, teraz MySpace &#8212; nie chcąc być gorszym &#8212; pokazał światu kod Qizmt, czyli frameworku MapReduce dla .NET.</p>
<p><!--header--><span id="more-51972"></span></p>
<p>Jak tłumaczą deweloperzy MySpace:</p>
<blockquote><p>Środowiska MapReduce stosowane są przez serwisy przetwarzające jednocześnie ogromne ilości danych, takie jak strony Google czy Amazon. Podobnie w MySpace, miliony użytkowników odtwarzają i tworzą treści wideo i inne, co powoduje przesyłanie przez sieć ogromnych ilości informacji. Qizmt przetwarza dane naszych użytkowników (aktywne dane) jak również dane generowane przez nasze systemy analityczne (pasywne) i generuje na ich podstawie rekomendacje w czasie rzeczywistym [...]</p></blockquote>
<p>MySpace wykorzystuje wprawdzie Qizmt głównie do generowania rekomendacji, ale framework jest podobno ogólny i może służyć do przetwarzania dowolnych danych.</p>
<p>Otwarcie kodu przez MySpace to na pewno świetna informacja dla wszystkich kodujących w środowisku .NET / Windows. Podobny framework &#8212; <a href="http://hadoop.apache.org/mapreduce/" class="extlink">Hadoop MapReduce</a> &#8212; rozwija jednocześnie Fundacja Apache.</p>
<p>Qizmt dostępny jest na licencji GNU GPLv3 i ściągnąć go można ze strony <a href="http://code.google.com/p/qizmt/" class="extlink">qizmt na Google Code</a> (gdzie też poczytać możemy o technicznych aspektach projektu).</p>
<div id="fb-root"></div><script src="http://connect.facebook.net/en_US/all.js#xfbml=1"></script><!-- Do not remove -->]]></content:encoded>
			<wfw:commentRss>http://osnews.pl/qizmt-czyli-hapoop-mapreduce-dla-net-od-myspace-i-rowniez-open-source/feed/</wfw:commentRss>
		<slash:comments>8</slash:comments>
		</item>
		<item>
		<title>Milion dolarów za rozszyfrowanie filmowych gustów</title>
		<link>http://osnews.pl/milion-dolarow-za-rozszyfrowanie-filmowych-gustow/</link>
		<comments>http://osnews.pl/milion-dolarow-za-rozszyfrowanie-filmowych-gustow/#comments</comments>
		<pubDate>Thu, 02 Jul 2009 19:34:30 +0000</pubDate>
		<dc:creator>mw</dc:creator>
				<category><![CDATA[Teksty]]></category>
		<category><![CDATA[algorytmy]]></category>
		<category><![CDATA[media]]></category>
		<category><![CDATA[programowanie]]></category>
		<category><![CDATA[rekomendacje]]></category>

		<guid isPermaLink="false">http://osnews.pl/milion-dolarow-za-rozszyfrowanie-filmowych-gustow/</guid>
		<description><![CDATA[Prawie trzy lata temu Netflix, amerykańska wysyłkowa wypożyczalnia filmów, ogłosiła konkurs na przewidywanie filmowych gustów. Główna nagroda &#8212; milion dolarów. Kilka dni temu jeden z zespołów znalazł algorytm spełniający wymagania konkursu, więc jest to dobry moment, żeby przypomnieć całą historię. W ciągu tych trzech lat informacje o netflix prize pojawiały się w różnych mediach, od [...]]]></description>
			<content:encoded><![CDATA[<p>Prawie trzy lata temu Netflix, amerykańska wysyłkowa wypożyczalnia filmów, ogłosiła <a href="http://www.netflixprize.com" class="extlink">konkurs</a> na przewidywanie filmowych gustów. Główna nagroda &#8212; milion dolarów. Kilka dni temu jeden z zespołów znalazł algorytm spełniający wymagania konkursu, więc jest to dobry moment, żeby przypomnieć całą historię.</p>
<p><!--header--><span id="more-47102"></span>
<p class="img-right"><img src="http://upload.wikimedia.org/wikipedia/en/1/1a/Netflixenvelope.jpg" alt="" width="245" height="150" /></p>
<p>W ciągu tych trzech lat informacje o <em>netflix prize</em> pojawiały się w różnych mediach, od technicznego magazynu <em><a href="http://www.wired.com" class="extlink">Wired</a></em> do <em><a href="http://www.nytimes.com/2008/11/23/magazine/23Netflix-t.html" class="extlink">New York Timesa</a></em> i <a href="http://www.npr.org/templates/story/story.php?storyId=98184833" class="extlink">amerykańskiego publicznego radia</a>. Autor nie brał udziału w konkursie, ale ponieważ nie zauważył zainteresowania polskich mediów tym ciekawym tematem, postanowił zwrócić na niego uwagę niniejszym tekstem.</p>
<p>Netflix to wypożyczalnia, która wysyła filmy pocztą (tradycyjną),  a od niedawna również przez Internet. Płacąc miesięczny abonament klient może wypożyczać płyty DVD tak często jak chce. Dla  przykładu, za $9 (mniej więcej tyle co bilet do kina albo niedrogi lunch w USA) można wypożyczać po jednym filmie, a za $17  po trzy naraz. Po odesłaniu filmów trzeba poczekać parę dni na  następną porcję &#8212; poczta musi dostarczyć przesyłkę tam i z  powrotem. 10M (milionów) klientów ma do dyspozycji 100k (tysięcy) tytułów na 55M płyt.  Wypożyczalnia wysyła dziennie około 2M płyt DVD i płaci  amerykańskiej poczcie ok. $300M rocznie.</p>
<p>Obejrzane filmy można oceniać, a system, analizując dotychczasowe  oceny, poleca kolejne pozycje. Na podstawie tych rekomendacji  klienci wypożyczają aż 60% filmów, więc odgadnięcie, co się komu  spodoba, jest ważne dla korporacji, bo zniechęceni klienci oglądają mniej filmów i nieraz, dochodząc do wniosku, że stały abonament im się nie opłaca, wracają do tradycyjnych wypożyczalni.</p>
<p>W 2006 roku, przed ogłoszeniem konkursu, było już wiele portali  wdrażających ideę wspólnej filtracji (<em><a href="http://en.wikipedia.org/wiki/Collaborative_filtering" class="extlink">collaborative filtering</a></em>) oraz sklepów internetowych stosujących spersonalizowane rekomendacje. Byli też naukowcy badający wzorce ludzkich wyborów i szukający  najlepszych algorytmów. Wśród nich grupa z Uniwersytetu stanu Minnesota, która przyjęła nazwę <em><a href="http://www.grouplens.org/" class="extlink">GroupLens</a></em>. Ta grupa zainwestowała sporo czasu w stworzenie <em><a href="www.movielens.org">MovieLens</a></em>, jednego z popularniejszych serwisów dających spersonalizowane rekomendacje filmowe. Dzięki temu dysponowała danymi do swoich badań &#8212; największą <em>akademicką</em> bazą filmowych ocen &#8212; w 2006 roku było to 13M ocen wystawionych przez 140k użytkowników. Mniej  więcej tyle ocen, ile Netflix otrzymywuje w ciągu tygodnia.</p>
<p>W październiku 2006 roku Netflix udostępnił małą część swoich danych, 100M ocen, i ogłosił konkurs na najlepszy algorytm przewidujący kolejne oceny. Udostępnione dane z ocenami miały postać czwórek: użytkownik &#8211; film &#8211; ocena &#8211; data wystawienia. Uczestnicy dostali też zbiór testowy w postaci trójek: użytkownik &#8211;  film &#8211; data, i zostali poproszeni o uzupełnienie tego zbioru o oceny. Dla ochrony prywatności klientów użytkownicy zostali oznaczeni numerami i jedyne, co o nich wiadomo, to kiedy i jak oceniali filmy. Upubliczniona baza danych, wraz z obiecaną nagrodą, dały nowy impuls do badań nad <em>collaborative filtering</em>.</p>
<p>W tamtym czasie naukowcy z Minnesoty wydawali się już zmęczeni  szukaniem najlepszego algorytmu i zajmowali się innymi tematami. Na przykład tym, czy trafność rekomendacji rzeczywiście odzwierciedla ich użyteczność. W <a href="http://www.grouplens.org/papers/pdf/mcnee-chi06-acc.pdf" class="extlink">jednej z publikacji</a> wręcz kontestowali istniejące algorytmy, porównując je do systemu dla turystów, który poleca nam podróże w te miejsca, w których już byliśmy. Badali też zagrożenia dla prywatności  wynikające z ujawniania swoich preferencji (<a href="http://video.google.pl/videoplay?docid=6474169875352273382" class="extlink">wideo z wykładu</a>). Wkrótce okazało się jednak, że szukając odpowiedzi na podstawowe pytanie, jaki matematyczny model najlepiej opisuje gusty ludzkie, można odkryć jeszcze wiele nowych rzeczy. I odkryją to uczestnicy konkursu.</p>
<p>Za punkt odniesienia w konkursie posłużył algorytm stosowany  wówczas przez Netflixa, nazwany <em>Cinematch</em>. Regulamin przewidywał,  że główna nagroda, milion dolarów, zostanie przyznana dopiero 30 dni po tym, jak jedna z drużyn osiągnie wynik o 10% lepszy niż <em>Cinematch</em> (teraz znamy już datę, 30 dni minie 26 lipca). W międzyczasie co rok przyznawano nagrodę za postępy, $50K dla  drużyny pierwszej w rankingu.</p>
<p>Za miarę skuteczności algorytmu przyjęto RMSE (pierwiastek z błędu średniokwadratowego, ang. <em>root mean squared error</em>). <em>Cinematch</em> miał RMSE=0.9525. W tydzień po ogłoszeniu konkursu pierwsza z drużyn dysponowała algorytmem dającym mniejszy RMSE.  Miesiąc później poprawa wynosiła już około 5%. Rok później &#8212;  ponad 8%, ale poprawianie wyników stawało się coraz trudniejsze. Pod koniec 2008 roku, kiedy najlepsze drużyny rozciągnięte były między 8 a 9%, niektórzy zawodnicy zastanawiali się, czy cel jest w ogóle możliwy do ociągnięcia. W końcu, dwa lata i 9 miesięcy po rozpoczęciu konkursu, 10% zostało przekroczone.</p>
<p>Zwykła średnia z ocen dla danego filmu, bez żadnej personalizacji, daje RMSE o ok. 10% większy niż <em>Cinematch</em>. RMSE o 10% mniejszy dawał z kolei główną nagrodę. Dużo wskazuje na to,  że pomiędzy prostą średnią a najlepszym możliwym algorytmem jest  dwadzieścia kilka procent różnicy, a szum, z którym nie da się  nic zrobić, przekracza poziom RMSE=0.8. Użytkownicy Netflixa mogą  mogą przyznawać filmom od 1 do 5 gwiazdek. Niepewność bliska  jednej gwiazdki wydaje się dość duża, bo przecież, obstawiając  ocenę na środku skali, możemy się pomylić najwyżej o 2 gwiazdki. Na szum, który uniemożliwia dokładniejsze prognozy, składają się czynniki, których nie sposób uwzględnić w modelu, takie jak nasz humor w trakcie oglądania filmu. Być może przeszkodą jest również mała ilość ocen na skali. Wielu użytkowników Netflixa narzeka na  brak połówkowych gwiazdek, ale przeprowadzone testy <a href="http://blog.netflix.com/2007/08/todd-speaks-12-stars.html" class="extlink">pokazały</a>, że większy wybór zniechęca ludzi do oceniania. Dziesięć procent  poprawy, które było celem konkursu, nie brzmi imponująca, jednak  według <a href="http://www.netflixprize.com/community/viewtopic.php?id=828" class="extlink">analizy</a> Yehudy Korena z drużyny prowadzącej w rankingu, niewielka  poprawa RMSE, nawet o 1%, przekłada się na znacznie trafniejszy  wybór polecanych filmów.</p>
<p class="img-left"><img src="http://www.doorg.info/wp-content/uploads/2009/07/screenshot1.png" alt="fragment interfejsu serwisu MovieLens" width="387" height="231" /></p>
<p><em>Cinematch</em>, tak samo jak algorytmy w MovieLens, Amazon i większości innych silników rekomendacji w 2006 roku, opierał się na podobieństwie filmów lub użytkowników. Jeśli ktoś ma gust podobny do mojego, to pewnie nasze oceny będą zbliżone również w przyszłości. Jeżeli dwa filmy są oceniane podobnie, to znaczy, że są podobne, więc jeśli wysoko oceniliśmy jeden z nich, to system zakłada, że spodoba nam się również drugi. Podobieństwo obliczano przy użyciu algorytmu <em>k</em> najbliższych sąsiadów (<a href="http://en.wikipedia.org/wiki/K-nearest_neighbor_algorithm" class="extlink">kNN</a>). Tym tropem szli też na samym początku uczestnicy konkursu. Wkrótce jednak nastąpił przełom.</p>
<p>Jedną z rzeczy, która zaskoczyła organizatorów konkursu, było to,  jak chętnie uczestnicy dzielą się swoimi doświadczeniami. Wprawdzie organizatorzy zadbali o forum dyskusyjne do wymiany myśli, ale współpraca drużyn przerosła ich oczekiwania. Dyskusje na forum dotyczyły różnych rzeczy. Narzędzi programistycznych. Osobliwości znalezionych w bazie danych, takich jak <em><a href="http://www.netflixprize.com/community/viewtopic.php?id=141" class="extlink">17k guy</a></em>, rekordzista, który ocenił prawie wszystkie filmy (ponad 17k) z udostępnionego podzbioru danych. Ale co najważniejsze, dotyczyły również stosowanych algorytmów. Wielu uczestników, czy to z braku wiary w wygraną, czy z akadmickich przyzwyczajeń, ujawniało swoje sekrety, dzięki czemu wszyscy czynili szybkie postępy.</p>
<p>Przełomem, który nastąpił w pierwszym miesiącu trwania konkursu,  było zastosowanie SVD, po polsku: rozkładu macierzy według  wartości szczególnych. Odpowiada to rozłożeniu filmów na czynniki, które mogą się podobać lub nie. Okazało się, że  porównywanie filmów całościowo daje gorszy rezultat niż porównywanie elementów, które składają się na film, a ludzki gust może być modelowany jako liniowe reakcje na poszczególne elementy. Dwie osoby mogą lubić tego samego aktora, ale jedna z nich może nie lubić magii albo przemocy. Końcowa ocena filmu, zawierającego te i inne elementy, będzie wypadkową wszystkich czynników. Przy dostatecznej ilości danych algorytm może te czynniki rozdzielić.  Jeden z członków zespołu prowadzącego w rankingu <a href="https://www.blogger.com/comment.g?blogID=2459417306268001648&amp;postID=1341886674317662296" class="extlink">pisze</a>, że modelowanie widza przy pomocy tylko 50 czynników daje całkiem dobre rezultaty, a powyżej 200 dalsze zwiększanie liczby czynników nie powoduje już poprawy. Powyższy przykład może być o tyle mylący, że film jest rozkładany na czynniki automatycznie. Komputer powie nam, w jakich filmach i w jakich ilościach występuje, dajmy na to, czynnik numer 23, ale interpretacja, co naprawdę te filmy mają ze sobą wspólnego i czemu dany czynnik odpowiada, wydaje się niemożliwa. Na szczęście, nie jest to potrzebne do przewidywania ocen. Co ciekawe, przydatność SVD dla <em>collaborative filtering</em> była już wzmiankowana w pracach naukowych w ubiegłym stuleciu, jednak do czasu konkursu Netflixa nie znalazła szerszego uznania.</p>
<p>Yehuda Koren, w <a href="http://public.research.att.com/~volinsky/netflix/kdd08koren.pdf" class="extlink">swojej pracy</a> przedstawionej na konferencji w ubiegłym roku, wyróżnia dwa rodzaje podejść do konkursowego problemu: modele sąsiedzkie (czyli podobieństwo filmów bądź użytkowników) i modele z ukrytymi czynnikami (takie jak SVD). Jak pisze, najlepsze rezultaty daje połączenie różnych modeli. Łączenie algorytmów jest tutaj bardzo proste. Dwa algorytmy można połączyć biorąc średnią z  przewidywanych ocen. Rozwiązania, które teraz znajdują się w czołówce rankingu, są liniową kombinacją wyników uzyskanych z setek różnych algorytmów.</p>
<p>Walcząc o ostatnie dwa procenty, zawodnicy stosowali coraz bardziej subtelne metody. W roku 2008 najważniejszym postępem stało się uwzględnienie daty oceny i zmienności gustu w czasie. Dużo pracy włożono też, aby zbudować lepszy model przy użyciu danych zewnętrznych, takich jak gatunek filmu albo występujący aktorzy. W końcu jednak okazało się, że dodatkowe informacje <a href="http://pragmatictheory.blogspot.com/2008/08/you-want-truth-you-cant-handle-truth.html" class="extlink">nic nie wnoszą</a> do przewidywania ocen.</p>
<p>Granicę 10% została przekroczona po połączeniu się dwóch drużyn z czołówki.  Powstały zespół, <em>BellKor&#8217;s Pragmatic Chaos</em>, aktualnie z wynikiem  10,05%, składa się łącznie z trzech drużyn, a jego najgroźniejszy konkurent, <em>Grand Prize Team</em>, 9,84%, to 9 zespołów, które wymieszały swoje wyniki.</p>
<p>Grupa <em>BellKor&#8217;s Pragmatic Chaos</em> składa się z siedmiu specjalistów  z USA, Kanady, Austrii i Izraela. Jeszcze nie jest pewne, czy to  oni zdobędą główną nagrodę, ale wygląda na to, że niektórzy z  pozostałych uczestników też mogą być zadowoleni z udziału w  zabawie. Ponad rok temu magazyn <em>Wired</em> <a href="http://www.wired.com/techbiz/media/magazine/16-03/mf_netflix" class="extlink">poświęcił</a> długi artykuł bezrobotnemu psychologowi z Londynu (bezrobotnemu z wyboru), który niespodziewanie znalazł się w czołówce. W matematyce pomagała mu córka. Obecnie psycholog prowadzi rodzinną firmę zajmującą się podobnymi analizami i pisze, że ma więcej zleceń niż jest w stanie przyjąć.</p>
<div id="fb-root"></div><script src="http://connect.facebook.net/en_US/all.js#xfbml=1"></script><!-- Do not remove -->]]></content:encoded>
			<wfw:commentRss>http://osnews.pl/milion-dolarow-za-rozszyfrowanie-filmowych-gustow/feed/</wfw:commentRss>
		<slash:comments>27</slash:comments>
		</item>
		<item>
		<title>Startuje Libre.fm czyli &#8222;wolne Last.fm&#8221;</title>
		<link>http://osnews.pl/startuje-librefm-czyli-wolne-lastfm/</link>
		<comments>http://osnews.pl/startuje-librefm-czyli-wolne-lastfm/#comments</comments>
		<pubDate>Tue, 21 Apr 2009 21:00:08 +0000</pubDate>
		<dc:creator>michuk</dc:creator>
				<category><![CDATA[Newsy]]></category>
		<category><![CDATA[internet]]></category>
		<category><![CDATA[libre.fm]]></category>
		<category><![CDATA[open-source]]></category>
		<category><![CDATA[rekomendacje]]></category>

		<guid isPermaLink="false">http://osnews.pl/startuje-librefm-czyli-wolne-lastfm/</guid>
		<description><![CDATA[Przed chwilą Matt Lee z Free Software Foundation ogłosił na Identi.ca publiczną wersję testową nowego projektu: Libre.fm, wolnego odpowiednika popularnego Last.fm &#8212; sewisu rekomendującego muzykę. Obecnie udostępniona wersja oznaczona jest jako alfa. Nie można więc spodziewać się cudów. Można jednak: przesyłać informacje o słuchanych piosenkach dzięki integracji z audioscrobbler.com oraz kilkoma odtwarzaczami audio, jak ZOMG [...]]]></description>
			<content:encoded><![CDATA[<p>Przed chwilą <a href="http://matt.lee.name/" class="extlink">Matt Lee</a> z Free Software Foundation <a href="http://identi.ca/notice/3603607" class="extlink">ogłosił na Identi.ca</a> publiczną wersję testową nowego projektu: <a href="http://libre.fm" class="extlink">Libre.fm</a>, wolnego odpowiednika popularnego <a href="http://last.fm" class="extlink">Last.fm</a> &#8212; sewisu rekomendującego muzykę.</p>
<p><!--header--><span id="more-41392"></span>
<p>Obecnie udostępniona wersja oznaczona jest jako alfa. Nie można więc spodziewać się cudów. Można jednak:</p>
<ul>
<li><a href="http://ideas.libre.fm/index.php/Using_turtle" class="extlink">przesyłać informacje o słuchanych piosenkach</a> dzięki integracji z audioscrobbler.com oraz kilkoma odtwarzaczami audio, jak ZOMG (wspiera wysyłanie piosenek jednocześnie do libre.fm i last.fm) czy Rhythmbox, Herrie i lastfmsubmitd (<a href="http://ideas.libre.fm/index.php/Client_Support" class="extlink">a tu lista tego co wspierane będzie</a>),</li>
<li>przeglądać rekomendacje nowych piosenek/artystów online,</li>
<li>porównać swój gust z gustem innych użytkowników</li>
</ul>
<p>Docelowo projekt ma m.in. pobierać muzykę z serwisów takich jak <a href="http://jamendo.com" class="extlink">Jamendo</a> i działać bardzo podobnie do Last.fm, tyle że oparty będzie na wolnych utworach. Więcej w <a href="http://ideas.libre.fm/index.php/Roadmap_for_libre.fm" class="extlink">Roadmapie</a>.</p>
<p>W skrócie, to taki <a href="http://filmaster.pl" class="extlink">Filmaster.pl</a> tylko dla muzyki <img src='http://osnews.pl/wp-includes/images/smilies/icon_smile.gif' alt=':)' class='wp-smiley' /> </p>
<p>Libre.fm jest wolnym oprogramowaniem. Dostępna jest wersja w PHP oraz alternatywna (niepełna) implementacja w Pythonie i Django. Nad projektem pracuje już spora <a href="http://savannah.nongnu.org/project/memberlist.php?group=librefm" class="extlink">grupa programistów</a>, ale każdy jest mile widziany.</p>
<p>Zachęcam do wzięcia udziału w testach i nie zrażania się chwilowymi niedoróbkami. Nie-programiści mogą pomóc np <a href="http://libre.fm/translations.php?lang=pl" class="extlink">tłumacząc serwis na język polski</a> lub <a href="http://bugs.libre.fm/" class="extlink">zgłaszając błędy</a> i <a href="https://savannah.nongnu.org/bugs/?group=librefm" class="extlink">propozycje ulepszeń</a>.</p>
<div id="fb-root"></div><script src="http://connect.facebook.net/en_US/all.js#xfbml=1"></script><!-- Do not remove -->]]></content:encoded>
			<wfw:commentRss>http://osnews.pl/startuje-librefm-czyli-wolne-lastfm/feed/</wfw:commentRss>
		<slash:comments>43</slash:comments>
		</item>
	</channel>
</rss>

