Netflix Prize

Netflix Prize — открытое соревнование на лучший алгоритм предсказания оценки, которую зритель поставит фильму, на основе предыдущих оценок этого и других зрителей. Соревнование проводил Netflix, крупная компания по аренде DVD. За некоторыми исключениями[1], участвовать могли все желающие. Главный приз составлял $1,000,000. Для его получения необходимо было улучшить алгоритм Netflix на 10 %.[2]

Приз был выдан команде BellKor’s Pragmatic Chaos 21 сентября 2009 года.

Общая информация

Netflix — фирма по аренде DVD с годовым оборотом 996 млн долларов (2006), основанная в 1997 году. Клиенты заказывают DVD через интернет и получают (и отправляют обратно) по почте. Клиенты могут выставлять фильмам оценки от 1 до 5. С течением времени Netflix накопила огромную базу данных, содержащую более миллиарда оценок[3], выставленных фильмам клиентами. На основе этой базы данных Netflix рекомендует клиентам фильмы, которые им с большой вероятностью понравятся. Алгоритм, предсказывающий, насколько тот или иной фильм понравится клиенту, основан на линейной регрессии[3] и называется Cinematch.

Тривиальный алгоритм, ставящий каждому фильму его среднюю оценку, даёт среднеквадратичное отклонение (СКО) 1,0540. Алгоритм Cinematch, использующий те данные, которые доступны участникам соревнования, даёт СКО 0,9525 на тестовом множестве, то есть он примерно на 10 % лучше тривиального алгоритма. Фирма заплатит главный приз команде, которая сможет улучшить результат ещё на 10 %.

Данные

Все участники (и вообще все желающие) могли скачать следующие 4 файла:

  • Обучающие данные (training data set) содержат 100.480.507 оценок, которые 480.189 клиентов поставили 17.770 фильмам. Каждая оценка представляет собой квадруплет <номер клиента, номер фильма, дата оценки, оценка>. Номера клиентов и фильмов — целые числа, оценка — целое число от 1 до 5 (низшая оценка 1, высшая 5).[4] Таким образом, в среднем каждый клиент поставил около 200 оценок, а каждый фильм получил около 5000. Однако количество оценок сильно варьируется: так, некоторые фильмы получили всего 3 оценки,[5], а один клиент оценил более 17 тыс. фильмов[6].
  • Квалификационные данные (qualifying data set) содержат 2,8 млн триплетов <пользователь, фильм, дата оценки>. Оценки известны только жюри и будут опубликованы по окончании соревнования.
  • Названия и годы выхода в прокат всех 17.770 фильмов.
  • Фрагмент обучающей базы данных, распределённый так же, как квалификационные данные. Этот фрагмент может использоваться, например, для оценки алгоритмов до посылки их на сайт.

Никакой информации о клиентах в базе данных нет.

Для защиты конфиденциальности клиентов, «некоторые данные из обучающего и квалификационного намеренно искажены одним или более из следующих способов: стирание оценок; вставка альтернативных оценок и дат; модификация дат».[2]

Каждый участник должен отправить файл с предсказаниями оценок из квалификационного набора данных. Предсказания могут быть и вещественными. В ответ сообщается среднеквадратичное отклонение (СКО) предсказаний, округлённое до 4-го знака после запятой. Список СКО лучших участников также вывешивается на сайте. Сами предсказания держатся в секрете.

Участник может отправлять предсказания не чаще раза в день. Учитывается лучший набор предсказаний каждого участника.

Для того чтобы участник не мог использовать СКО для угадывания оценок, квалификационный набор данных разделён на двое. Участникам сообщаются результаты одной из половинок, называемой quiz set, но для получения приза (любого) учитываются результаты другой половинки — test set. Участники не знают, какая из записей к какой половинке относится.

Были споры по поводу выбора метрики. Действительно ли уменьшение ошибки на 10 % поможет пользователям? По мнению одного из участников соревнования, улучшение ошибки даже на 0,01 существенно изменит список 10 рекомендованных фильмов.[7].

Призы

Cinematch, используя только те данные, которые доступны участникам, достигает СКО 0,9514 на quiz set и 0,9525 на test set. Это примерно на 10 % лучше тривиального алгоритма, ставящего каждому фильму его среднюю оценку. Для получения главного приза, в 1 млн долларов необходимо улучшить СКО ещё на 10 %, получив 0,8572 на test set. (Такое улучшение соответствует СКО 0,8563 на quiz set.)

До тех пор пока главный приз не будет завоёван, ежегодно лучшей команде будет присуждаться приз за прогресс (progress prize) в размере 50 тыс. долларов. Но для того, чтобы получить этот приз, команда должна улучшить СКО не менее чем на 1 % по сравнению с предыдущим лауреатом приза (в первый год — по сравнению с Cinematch).

Чтобы получить любой приз, команда должна в течение недели предоставить исходный код алгоритма, его описание и неисключительную лицензию на использование его алгоритма компанией Netflix. Исходный код и описание проверяются. Netflix публикует описание, но не исходный код. Сами предсказания также остаются секретными. Команда может отказаться от приза для того, чтобы сохранить в секрете свой алгоритм. Тогда приз получает следующая команда, если её СКО достаточно хорош.

После того, как одна из команд сумеет улучшить СКО на 10 % или больше, жюри даёт всем участникам ещё 30 дней, чтобы послать свои результаты. Затем у команды, пославшей лучший набор предсказаний, запрашиваются описание алгоритма, исходный код и неисключительная лицензия, и, в случае успешной проверки, команда объявляется победителем и получает главный приз. На этом соревнование завершается.

История и результаты

Соревнование началось 2 октября 2006 года. Уже 8 октября команда WXYZConsulting превзошла результаты Cinematch.[8] К 15 октября было уже 3 компании с результатами лучшими, чем Cinematch. Одна из них превзошла Cinematch на 1,06 %, этого достаточно, чтобы получить приз за прогресс.[9] К июню 2007 для участия в соревновании зарегистрировались более 20 тысяч команд из более чем 150 стран. 2000 команд послали 13 тысяч наборов предсказаний.

В первый год соревнования лидерами гонки были следующие команды:

2007

12 августа 2007 многие участники собрались на конференцию «KDD Cup and Workshop 2007».[10] в Сан-Хосе, Калифорния. На конференции все четыре ведущих группы представили свои техники.

2 сентября 2007 участникам осталось 30 дней до присуждения приза за прогресс 2007 года. В начале этого срока лучший результат был у BellKor с её СКО 0,8728 (улучшение на 8,26 %), за которой следовали Dinosaur Planet (СКО=0.8769; улучшение на 7,83 %) и Gravity (СКО=0.8785; улучшение на 7,66 %). В последний час перед присуждением приза первое место занял KorBell. Как оказалось, это другое имя команды BellKor.

13 ноября 2007, KorBell был объявлен лауреатом приза за прогресс в размере $50,000.[11] с СКО 0.8712 (улучшение на 8,43 %). Команда состояла из трёх исследователей из AT&T: Иегуды Корена (Yehuda Koren), Роберта Белла (Robert Bell) и Криса Волински (Chris Volinsky).[12] Как и требуется правилами, они опубликовали описание своего алгоритма.[13]

2008

BellCor объединился с BigChaos. Объединённая команда «BellKor in BigChaos» достигла улучшения в 9,44 % (СКО=0.8616) и получила приз за прогресс.[14] Участники команды опубликовали описание использованного алгоритма.[15][16]

2009

26 июня команда «BellKor’s Pragmatic Chaos», образованная слиянием команд «BellKor in BigChaos» и «Pragmatic Theory», достигла улучшения в 10,05 % (СКО=0.8558) по сравнению с Cinematch[17], и таким образом соревнование перешло в завершающую фазу. С этого момента всем участникам отводилось 30 дней для отправки окончательных решений.

25 июля, за день до конца соревнования, команда «The Ensemble», образованная слиянием команд «Grand Prize Team» и «Opera Solutions and Vandelay United», опередила «BellKor’s Pragmatic Chaos», достигнув улучшения в 10,09 % (СКО=0.8554).[18]

26 июля 2009 года, в 18:42:37 UTC приём решений прекращён. В этот момент верхушка таблицы результатов выглядела следующим образом:[19]

Команда СКО Улучшение в % Время отправки
1 The Ensemble 0.8553 10.10 2009-07-26 18:38:22
2 BellKor’s Pragmatic Chaos 0.8554 10.09 2009-07-26 18:18:28

По информации от участников команд на форуме соревнования[20] и австрийской газеты «Kurier»[21], на секретной половине данных алгоритм команды «BellKor» превосходил алгоритм «The Ensemble», так что ожидалось, что победителем официально будет признана команда «BellKor’s Pragmatic Chaos».

Согласно правилам, участники победившей команды должны были предоставить компании Netflix описания использованных алгоритмов и исходный код, и только потом Netflix официально объявила победителя соревнования. Им действительно оказалась команда «BellKor’s Pragmatic Chaos». Официальное объявление результатов и церемония награждения состоялись 21 сентября 2009. В тот же день были опубликованы секретные оценки.[22]

Как оказалось, на секретной половине данных обе команды улучшили результаты на 10,06 %, но команда «BellKor’s Pragmatic Chaos» прислала свои результаты на 20 минут раньше (см. таблицу).

Примечания

  1. В соревновании запрещено участвовать тем, кто связан с фирмой (нынешние и бывшие сотрудники, агенты, контракторы, близкие родственники перечисленных и т. д.), жителям Ирана, Кубы, Мьянмы, Северной Кореи, Сирии и Судана. Кроме того, Netflix оставляет за собой право дисквалифицировать любого участника. https://www.netflixprize.com/assets/rules.pdf Архивная копия от 10 мая 2020 на Wayback Machine
  2. 1 2 "The Netflix Prize Rules". Дата обращения: 21 августа 2007. Архивировано 3 марта 2012 года.
  3. 1 2 Netflix Prize: FAQ Архивировано 21 августа 2007 года.
  4. James Bennett (12 августа 2007). "The Netflix Prize" (PDF). Proceedings of KDD Cup and Workshop 2007. Архивировано из оригинала (PDF) 27 сентября 2007. Дата обращения: 25 августа 2008. {{cite conference}}: Неизвестный параметр |coauthors= игнорируется (|author= предлагается) (справка) Источник. Дата обращения: 20 января 2008. Архивировано из оригинала 27 сентября 2007 года.
  5. Sigmoid Curve. "Miss Congeniality". Netflix Prize Forum (8 октября 2006). Дата обращения: 25 августа 2008. Архивировано из оригинала 3 марта 2012 года.
  6. prodigious. "A single customer that rated 17,000 movies". Netflix Prize Forum (6 октября 2006). Дата обращения: 25 августа 2008. Архивировано из оригинала 3 марта 2012 года.
  7. YehudaKoren. How useful is a lower RMSE? Netflix Prize Forum (18 декабря 2007). Архивировано из оригинала 3 марта 2012 года.
  8. "Netflix Prize Rankings". Hacking NetFlix (9 октября 2006). Дата обращения: 21 августа 2007. Архивировано из оригинала 3 марта 2012 года.
  9. "Netflix Prize (I tried to resist, but...)". Juho Snellman's Weblog (15 октября 2006). Дата обращения: 21 августа 2007. Архивировано из оригинала 3 марта 2012 года.
  10. The KDD Cup and Workshop 2007. Архивировано из оригинала 3 марта 2012 года.
  11. Prizemaster. Netflix Progress Prize 2007 awarded to team KorBell. Netflix Prize Forum (13 ноября 2007). Архивировано из оригинала 3 марта 2012 года.
  12. $50,000 Progress Prize is Awarded on First Anniversary of $1 Million Netflix Prize. Архивировано из оригинала 17 декабря 2007 года.
  13. R. Bell, Y. Koren, C. Volinsky. "The BellKor solution to the Netflix Prize" (2007). Архивировано из оригинала 3 марта 2012 года.
  14. Prizemaster. Netflix Progress Prize 2008 to Team BellKor in BigChaos. Netflix Prize Forum (10 декабря 2008). Архивировано из оригинала 3 марта 2012 года.
  15. A. Töscher, M. Jahrer. "The BigChaos solution to the Netflix Prize 2008" (2008). Архивировано из оригинала 3 марта 2012 года.
  16. R. Bell, Y. Koren, C. Volinsky. "The BellKor solution to the Netflix Prize 2008" (2008). Архивировано из оригинала 3 марта 2012 года.
  17. BellKor's Pragmatic Chaos (26 июня 2009). Архивировано из оригинала 3 марта 2012 года.
  18. The Ensemble (25 июля 2009). Архивировано из оригинала 3 марта 2012 года.
  19. The Netflix Prize Comes To A Buzzer-Beater, Nailbiting Finish (26 июля 2009). Архивировано из оригинала 3 марта 2012 года.
  20. Netflix Prize forum post (26 июля 2009). Архивировано из оригинала 3 марта 2012 года.
  21. Die Eine-Million-Dollar-Formel (28 июля 2009). Архивировано из оригинала 3 марта 2012 года.
  22. UCI Machine Learning Repository: Data Set. Дата обращения: 22 сентября 2009. Архивировано 25 сентября 2009 года.

Ссылки

Read other articles:

2. Eurovision Song Contest Datum 3. März 1957 Austragungsland Deutschland Bundesrepublik BR Deutschland Austragungsort Großer Sendesaal des Hessischen Rundfunks, Frankfurt am Main Austragender Fernsehsender für die Moderation Anaid Iplicjian Teilnehmende Länder 10 Gewinner Niederlande Niederlande Siegertitel Corry Brokken: Net als toen Erstmalige Teilnahme Danemark Dänemark,Osterreich Österreich,Vereinigtes Konigreich Vereinigtes Königreich Abstimmungsregel Jed...

 

New Concepts of Artistry in Rhythm Studioalbum von Stan Kenton Veröffent-lichung(en) 1953 Label(s) Capitol Format(e) LP, CD Genre(s) Jazz Länge 47:36 Besetzung Piano: Stan Kenton Trompete: Conte Candoli, Buddy Childers, Maynard Ferguson, Don Dennis, Ruben McFall Posaune: Bobby Burgess, Keith Moon, Frank Rosolino, Bill Russo Bass-Posaune: George Roberts Altsaxophon: Lee Konitz, Vinnie Dean Tenorsaxophon: Richie Kamuca, Bill Holman Baritonsaxophon: Bob Gioga Gitarre: Sal Salvador Bass: Don Ba...

 

L'article palmarès et statistiques d'Andy Murray traite des différents résultats obtenus par Andy Murray, joueur de tennis britannique (Écosse). Principaux moments En août 2008, Murray remporte son premier Masters 1000 de sa carrière en s'imposant à Cincinnati en battant notamment Novak Djokovic en finale. Par la même occasion il intègre le Top 5 pour la première fois de sa carrière. Il remporte son second Masters 1000 la même année à Madrid en battant Roger Federer et Andy Rodd...

Als Unterpräfektur werden in verschiedenen Ländern Verwaltungseinheiten unterhalb der Präfektur-, Provinz- oder Gemeindeebene bezeichnet. Frankreich Sous-préfecture in Verdun In Frankreich bezeichnet die Unterpräfektur (frz. sous-préfecture) eine Verwaltungsebene unterhalb des Départements und der Region. Der Standort der Unterpräfektur ist die Hauptstadt (frz. chef-lieu) eines Arrondissements; der oberste Verwaltungsbeamte eines Arrondissements ist der Unterpräfekt (frz. sous-préfe...

 

2010 American action thriller drama television series This article is about the 2010 TV series. For the 1997 TV series, see La Femme Nikita (TV series). NikitaGenre Drama Thriller Action Spy fiction Psychological thriller Created byCharacters:Joel Surnow (original series)Based onLa Femme Nikitaby Luc BessonDeveloped byCraig SilversteinStarring Maggie Q Shane West Lyndsy Fonseca Aaron Stanford Ashton Holmes Tiffany Hines Melinda Clarke Xander Berkeley Dillon Casey Noah Bean Devon Sawa Theme mu...

 

Djiboutian NavyMarine Nationale Djiboutienne (French)Ciidanka Badda Jabuuti (Somali)ActiveApril 1979; 44 years ago (April 1979)Country DjiboutiTypeNavySizeNavy fleets: 1,500 Active Personnel 24 Patrol Vessels 2 Transport 3 Landing craft Part ofDjibouti Armed ForcesHeadquartersDjibouti CityNickname(s)DNEngagementsDjiboutian–Eritrean border conflictCommandersChief of the Djiboutian NavyColonel Abdourahman Aden CherInsigniaNaval EnsignMilitary unit The Djibouti...

This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Tahir bin Jalaluddin – news · newspapers · books · scholar · JSTOR (February 2007) (Learn how and when to remove this template message) Dr. Haji Abdul Karim Amrullah (left), Sheikh Tahir Jalaluddin (center), and Sheikh Daud Rasyidi (right) Sheikh Tahir Jalaludd...

 

2005 superhero film by Christopher Nolan This article is about the film. For the tie-in video game, see Batman Begins (video game). Batman BeginsTheatrical release posterDirected byChristopher NolanScreenplay by Christopher Nolan David S. Goyer Story byDavid S. GoyerBased onCharacters appearing in comic books publishedby DC ComicsProduced by Charles Roven Emma Thomas Larry Franco Starring Christian Bale Michael Caine Liam Neeson Katie Holmes Gary Oldman Cillian Murphy Tom Wilkinson Rutger Hau...

 

For the deanery of the same name in the Diocese of Lincoln, see Deanery of Christianity (Lincoln). The Deanery of Christianity is a deanery in the Archdeaconry of Exeter, Diocese of Exeter. The deanery covers most of the city of Exeter. It takes the name Christianity because there is a tradition that a diocese and a deanery should not share the same name. Benefice of Alphington (St Michael and All Angels) Parishes within the mission community: St Michael and All Angels, Alphington St George, ...

Museu Picasso成立日期1963地址西班牙巴塞羅那類型美術館参观人數1,045,837(2010)館長Bernardo Laniado-Romero策展人Malén Gual網站www.museupicasso.bcn.cat 畢加索博物館(加泰隆尼亞語:Museu Picasso 加泰羅尼亞語發音:[muˈzɛw piˈkasu])是一座位于西班牙巴塞羅那的美術館,收藏有4,251件西班牙藝術家畢加索的作品。博物館佔據了里贝拉的五所中世紀宮殿。[1] 1963年3月9日開張時是世界上...

 

Canadian comic book publisher Chapterhouse Comics GroupFounded2015[1]Country of originCanadaHeadquarters locationToronto, OntarioDistributionDiamond Book Distributors[2]Key peopleFadi HakimKalman AndrasofszkyJay Baruchel[3]Publication typesComicsOfficial websitechapterhouse.ca Comic House (formerly Chapterhouse)[4] is a Canadian comic publishing company[5] that publishes books featuring classic Canadian comic book characters such as Captain Canuck and N...

 

US international rugby league footballer Steele RetchlessPersonal informationFull nameSteele Andrew RetchlessBorn (1971-06-16) 16 June 1971 (age 52)Brisbane, Queensland, AustraliaPlaying informationHeight178 cm (5 ft 10 in)Weight98 kg (15 st 6 lb)PositionSecond-row, Prop Club Years Team Pld T G FG P 1995–96 Brisbane Broncos 11 1 0 0 4 1997 South Qld Crushers 22 3 0 0 12 1998–04 London Broncos 201 17 0 0 68 Total 234 21 0 0 84 Representative Year...

Indian film and theatre actor (born 1984) Jatin SarnaSarna in 2018Born (1984-11-02) 2 November 1984 (age 39)New Delhi, IndiaAlma materShri Ram Centre for Performing Arts New DelhiOccupationActor Jatin Sarna (born 2 November 1984) is an Indian actor who appears in Hindi films and theatre.[1] He is best known for his work in Meeruthiya Gangsters,[2] Saat Uchakkey,[3] Sonchiriya, Darbar, 83 and Sacred Games, an original Netflix series, Khakee: The Bihar Chapter....

 

Historical and cultural region in Pakistan RegionDerajat ڈیرہ جاٹRegionProvinces Balochistan Khyber Pakhtunkhwa PunjabDemographics • Ethnic groupsSaraikis, BalochsMinor: Pashtuns • LanguagesPashtoSaraiki, Urdu, Hindko, BalochiTime zonePakistan Standard TimeLargest citiesDera Ghazi KhanDera Ismail KhanRajanpurDera Bugti Derajat (Punjabi/Urdu: ڈیرہ جاٹ), the plural of the word 'dera',[1] is a cultural region of central Pakistan, located in the regio...

 

36°26′33.7″N 140°35′45.1″E / 36.442694°N 140.595861°E / 36.442694; 140.595861 Headquarters of the Japan Atomic Energy Agency The Japan Atomic Energy Agency (日本原子力研究開発機構, Nihon genshiryoku kenkyū kaihatsu kikō, JAEA) is an Independent Administrative Institution formed on October 1, 2005 by a merger of two previous semi-governmental organizations. While it inherited the activities of both JNC and JAERI, it also inherited the nickname o...

Board game This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Enchanted Forest game – news · newspapers · books · scholar · JSTOR (November 2011) (Learn how and when to remove this template message) Playing pieces from the original Sagaland (1981) Enchanted Forest is a board game designed by Alex Randolph ...

 

Запрос «Элементарные частицы» перенаправляется сюда; см. также другие значения. Краткий обзор различных семейств элементарных и составных частиц и теории, описывающие их взаимодействия. Элементарные частицы слева — фермионы, справа — бозоны. (Термины — гиперссылки ...

 

Presumptive serological test for enteric fever or undulant fever This article needs more reliable medical references for verification or relies too heavily on primary sources. Please review the contents of the article and add the appropriate references if you can. Unsourced or poorly sourced material may be challenged and removed.Find sources: Widal test – news · newspapers · books · scholar · JSTOR (February 2019) Widal testPurposeserological test for...

Prime Minister of Egypt (1924–1926) For other people named Ahmad Pasha, see Ahmad Pasha (disambiguation). Ahmed Ziwar Pasha c. 1920 Ahmed Ziwar Pasha (1864–1945) (Arabic: أحمد زيوار باشا)[citation needed] was the prime minister of Egypt from 24 November 1924 to 7 June 1926.[1] References ^ Former Prime Ministers, Arab Republic of Egypt: Cabinet of Ministers, archived from the original on 14 December 2010, retrieved 27 October 2022 Preceded bySaad Zaghlul ...

 

English musical instrument manufacturer This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Tanglewood Guitars – news · newspapers · books · scholar · JSTOR (March 2012) (Learn how and when to remove this template message) Tanglewood GuitarsA Tanglewood guitarIndustryMusical instrumentsFounded1988; 35...

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!