Logiciels de fouille de données

Les logiciels de fouille de données sont des programmes spécialisés dans l'analyse et l'extraction des connaissances à partir des données informatisées. Ce sont des logiciels qui aident l'analyste en exploration de données à trouver des motifs remarquables et intéressants. Il peut s'agir de logiciels commerciaux ou de logiciels libres.

Logiciels libres

Parmi les logiciels libres, quelques-uns sortent du lot :

Logo de Knime

KNIME (prononcer NAÏM), acronyme de Konstanz Information Miner, est un logiciel libre édité par un laboratoire de l'université de Constance dénommé Nycomed Chair for Bioinformatics and Information Mining. Il intègre notamment tous les modules d'analyse de Weka et permet de créer des scripts en langage R. Ces deux logiciels sont décrits ci-dessous. KNIME s'exécute sur Linux, Windows et MacOS. Comme tous les logiciels libres, KNIME est extensible.

Logo de R

R est un langage et un environnement permettant d'effectuer des calculs statistiques et de créer leurs graphiques. Sous licence GNU, R est semblable au langage S et à son environnement créé aux Laboratoires Bell par John Chambers et ses collègues. R peut être considéré comme une autre mise en œuvre de S. Il y a quelques différences importantes, mais beaucoup de code écrit pour S s'exécute inchangé sous R. R fournit un large éventail de techniques statistiques et graphiques telles que la modélisation linéaire et non linéaire, les tests statistiques classiques, l'analyse des séries chronologiques, la classification et le clustering, entre autres. Il peut être fortement étendu par des programmes développés par la communauté. Le langage S est souvent le véhicule de choix pour la recherche en matière de méthodologie statistique, et R fournit une voie open source à la participation à cette activité. Un des atouts de R est la facilité avec laquelle des graphiques bien conçus, de qualité digne de publication, peuvent être produits, contenant des symboles mathématiques et des formules si besoin est. Un grand soin a été accordé à la prise en charge des options par défaut pour les choix mineurs dans la conception des graphiques, mais l'utilisateur conserve le contrôle complet de ces options. R est publié selon les termes de la licence GNU sous forme de code source. Il se compile et s'exécute sous une grande variété de plates-formes UNIX et de systèmes similaires, y compris FreeBSD et Linux, Windows et MacOS.

Logo d'Orange

Orange est un logiciel libre créé à l'université de Ljubljana en Slovénie. Ce logiciel est doté d'une interface homme-machine conviviale. Il est développé en C++ et en Python. Chaque algorithme se présente sous la forme de widgets pouvant avoir une entrée et une sortie ; ils sont agencés dans une fenêtre[1].RapidMiner est un logiciel libre distribué par la société Rapid-I, basée à Dortmund en Allemagne. Il intègre le Business Intelligence dont les principales fonctionnalités sont l'ETL, l'OLAP, la production d'états et l'exploration de données et les techniques classiques comme les SVM, l'ACP, les arbres de décision et les réseaux neuronaux. Ce produit est aussi distribué en version commerciale.

Tanagra est un logiciel libre d'exploration de données développé sous la direction de Ricco Rakotomalala du laboratoire ERIC de l'Université Lumière Lyon 2. Il permet d'effectuer les traitements d'analyses factorielles telles que l'ACP, l'AFC, l'ACM, la régression PLS, de classification non supervisée avec l'algorithme des k-means et l'algorithme hiérarchique ascendant. Il permet aussi d'importer des fichiers au format weka[1].

Logo de Weka

Weka est un logiciel libre de fouille de données créé par l'université de Waikato (Nouvelle-Zélande). C'est une collection d'algorithmes d'apprentissage automatique mis en place pour effectuer des tâches d'exploration de données[2]. Les algorithmes peuvent soit être appliqués directement à un ensemble de données soit être appelés directement par un code Java développé par une équipe informatique indépendante par exemple. Weka contient des outils pour les prétraitements des données, la classification, la régression, le clustering, les règles d'association et la visualisation. Il est également bien adapté au développement de nouveaux schémas pour l'apprentissage automatique. C'est un logiciel open source publié sous la LGPL[1].

Logiciels commerciaux

Les logiciels commerciaux sont édités par des sociétés bien connues sur le marché.

KXEN Analytic Framework est un logiciel commercial édité par la société KXEN basée en Californie et fondée en 1998. Les modules de KXEN Analytic Framework permettent la prédiction, la segmentation, les associations, la prévision à l'aide de KPIs, la fouille de textes et l'analyse des réseaux sociaux.

Logo de SAS

Microsoft propose une solution de fouille de données limitée, déduite de son offre en Business intelligence[3], que l'on peut mettre en place soit en utilisant les outils de développement associés à SSAS pour la population des développeurs, soit en utilisant l'Add-in Data mining proposé pour Excel 2007 ou Powerpivot pour les statisticiens.

SAS Enterprise Miner est un outil commercial édité par la société SAS Institute Inc.. C'est un logiciel offrant toutes les facettes de l'exploration de données dont le processus est facilité par son interface homme-machine bien conçue.[non neutre]

Le logo de SPSS

SPSS (Statistical Package for the Social Sciences) est un logiciel de statistiques, édité par la filiale d'IBM du même nom, qui se décompose en plusieurs modules dont SPSS Modeler pour le Data mining, SPSS Amos pour les modèles d'équation structurelle et Predictive Analytics pour l'analyse prédictive.

Statistica Data Miner, de la société Statsoft, Inc, est un logiciel commercial intégrant diverses techniques statistiques et graphiques, des algorithmes de réseaux de neurones, des méthodes avancées d'arbres de décision, des règles d'association, du boosting, des forêts aléatoires, de la fouille de texte, de l'optimisation de processus et différentes techniques de modélisation prédictive pour des tâches de classification ou de régression.

Braincube, d'IP Leanware, est un leader mondial de la plateforme IIoT avec solution Edge et Cloud sur le marché émergent de l'Internet industriel des objets (IIoT). Braincube propose des applications d'intelligence opérationnelle et de Business Intelligence pour une vision en temps réel et en Big Data. Braincube utilise des algorithmes d'IA et de Machine Learning exclusifs et personnalisés qui mesurent l'impact entre les variables et trouvent des solutions de fonctionnement optimales. Elle est spécialisée dans les cas d'utilisation de la fabrication continue et discontinue.

GPC System est une société qui développe une solution originale et brevetée d'analyse multivariée des procédés de fabrication discrets et continus. Ses algorithmes exclusifs permettent de détecter en temps réel des anomalies en cours de survenance. Les anomalies sont détectées par analyse statistique spécifique multidimensionnelle (ellipsoïde de bon fonctionnement avec détection de directions de fuites) puis analysées par les gens de métier. Elles sont alors décrites clairement pour les opérateurs des lignes de production. Des consignes explicites d'actions, préventives ou curatives, sont également définies pour assurer un pilotage optimisé et la conformité finale du produit.

CORICO est un logiciel commercial intégrant l’ Iconographie des corrélations et les Interactions logiques, qui se prêtent bien à l’analyse multi relationnelle. Il intègre aussi une technique de modélisation prédictive fondée sur les modèles de régression multiple postulés et non postulés.

Logiciels spécialisés

En fouille de données spatiales, les logiciels sont aptes à analyser, requêter et tenir compte des spécificités des données spatiales.

Satisfaction des utilisateurs

Les outils les plus utilisés[4] sont, en 2009, dans l'ordre, SPSS, RapidMiner, SAS, Excel, R, KXEN, Weka, Matlab, Knime, Microsoft SQL Server, Oracle DM et STATISTICA.

R[5] est l'outil le plus utilisé parmi les utilisateurs ayant répondu au sondage de Rexer Analytics[6] et STATISTICA apparaît comme l'outil de data mining préféré par la plupart des dataminers (18 %). STATISTICA, IBM SPSS Modeler, et R ont reçu les taux de satisfaction les plus élevés à la fois en 2010 et 2009 dans ce sondage de Rexer Analytics.

Références

  1. a b et c René Lefebure, « Pour une comparaison Weka, Tanagra, Orange » (consulté le )
  2. (en) « Traduction du paragraphe « Weka 3: Data Mining Software in Java » » (consulté le )
  3. (en) « Data mining with Sql server 2008R2 » (consulté le )
  4. (en) « Data Mining Tools Used Poll », (consulté le )
  5. (en) Rexer Analytics, « 2010 Data Miner Survey » (consulté le )
  6. (en) Rexer Analytics, « Rexer Analytics » (consulté le )

Voir aussi

Bibliographie

  • Stéphane Tufféry, Data Mining et statistique décisionnelle : l'intelligence des données, Paris, éditions Technip, , 3e éd., 705 p. (ISBN 978-2-7108-0946-3, lire en ligne)

Read other articles:

Numb/EncoreSingel oleh Linkin Park dan Jay-Zdari album Collision CourseDirilis13 Desember 2004FormatCDDirekam2004GenreRapcoreDurasi3:25LabelWarner Bros. RecordsRoc-a-Fella RecordsPenciptaLinkin ParkJay-ZKanye WestProduserMike Shinoda Numb/Encore adalah singel pertama dari album kolaborasi antara Linkin Park dan Jay-Z, Collision Course. Singel ini dirilis pada tanggal 16 November 2004. Singel ini tidak dirilis di Selandia Baru. Informasi Lagu Numb/Encore merupakan gabungan dari lagu Jay-Z Enco...

 

 

Si ce bandeau n'est plus pertinent, retirez-le. Cliquez ici pour en savoir plus. La mise en forme de cet article est à améliorer (novembre 2023). La mise en forme du texte ne suit pas les recommandations de Wikipédia : il faut le « wikifier ». Comment faire ? Les points d'amélioration suivants sont les cas les plus fréquents. Le détail des points à revoir est peut-être précisé sur la page de discussion. Les titres sont pré-formatés par le logiciel. Ils ne son...

 

 

هذه المقالة يتيمة إذ تصل إليها مقالات أخرى قليلة جدًا. فضلًا، ساعد بإضافة وصلة إليها في مقالات متعلقة بها. (مارس 2019) مالكوم بروكس معلومات شخصية تاريخ الميلاد 16 يونيو 1930  تاريخ الوفاة 19 يونيو 2020 (90 سنة)   مواطنة أستراليا  الحياة العملية المهنة سياسي  اللغات الإنجليزي...

Berger Mühle Die Berger Mühle auf der Urkarte von 1846 Die Berger Mühle auf der Urkarte von 1846 Lage und Geschichte Berger Mühle (Nordrhein-Westfalen) Koordinaten 50° 51′ 53″ N, 6° 7′ 3″ O50.8646646.117463Koordinaten: 50° 51′ 53″ N, 6° 7′ 3″ O Standort Deutschland Nordrhein-Westfalen Städteregion Aachen Herzogenrath Gewässer Broicher Bach Erbaut 17./18. Jahrhundert Stillgelegt 1935 Technik Nutzung Getreidem...

 

 

2009 compilation album by Električni OrgazamThe Ultimate CollectionCompilation album by Električni OrgazamReleased2009Recorded1980-2007GenreNew wave, punk rock, post-punk, psychedelic rock, rockLength52:03LabelCroatia RecordsElektrični Orgazam compilations chronology Breskve u teškom sirupu vol. 1(2006) The Ultimate Collection(2009) Professional ratingsReview scoresSourceRatingMuzika.hr [1] The Ultimate Collection is the sixth compilation album by the Serbian rock band Ele...

 

 

High security hospital in Berkshire, England Broadmoor redirects here. For other uses, see Broadmoor (disambiguation). Hospital in Berkshire, EnglandBroadmoor HospitalWest London NHS TrustBroadmoor in 2006Shown in BerkshireGeographyLocationCrowthorne, Berkshire, EnglandCoordinates51°22′09″N 00°46′43″W / 51.36917°N 0.77861°W / 51.36917; -0.77861OrganisationCare systemNational Health ServiceTypePsychiatricServicesEmergency departmentNoBeds284HistoryOpened1863...

إبراهيم بن سعد آل إبراهيم سفير السعودية لدى تونس في المنصب1986 – 1992 عبد الرحمن البسام محمد بن محمود آل علي سفير السعودية لدى مصر في المنصب1997 – 2006 أسعد عبد الكريم أبو النصر محمد بن حمد آل خليفة سفير السعودية لدى الإمارات العربية المتحدة في المنصب21 سبتمبر 2013 – 20 مايو 2014 محمد إب...

 

 

  لمعانٍ أخرى، طالع قونكة (توضيح).   قونكة (بالإسبانية: Cuenca)‏    قونكة (إسبانيا) قونكة (إسبانيا)  خريطة الموقع تقسيم إداري البلد إسبانيا  [1][2] العاصمة قونكة التقسيم الأعلى قشتالة-لا مانتشا  خصائص جغرافية إحداثيات 40°N 2°W / 40°N 2°W / 40; -2  &#...

 

 

For the Crystal Castles song, see Magic Spells (song). For the spell, see magic spell. 2010 live album by ApocalypseMagic SpellsLive album by ApocalypseReleased2010GenreProgressive rockLabelFinanciarteProducerApocalypseApocalypse chronology The Bridge of Light(2008) Magic Spells(2010) 2012 Light Years from Home(2011) Magic Spells is the third live album from the Brazilian progressive rock band Apocalypse released on Financiarte label. The album is part of the Apocalypse 25th Anniversa...

Recurring sporting event For the professional wrestler, see Jerry Stubbs. Mr. OlympiaThe Mr. Olympia stage in 2008LocationUnited States← 2023 Mr. Olympia2024 Mr. Olympia → Mr. Olympia is the title awarded to the winner of the professional men's bodybuilding contest in the open division at Olympia Fitness & Performance Weekend—an international bodybuilding competition that is held annually and is sanctioned by the IFBB Professional League.[1] Joe Weider crea...

 

 

Extinct genus of dinosaurs Not to be confused with Lewisuchus. LaevisuchusTemporal range: Late Cretaceous, 70 Ma PreꞒ Ꞓ O S D C P T J K Pg N ↓ Cervical vertebra K20/613 in multiple views Scientific classification Domain: Eukaryota Kingdom: Animalia Phylum: Chordata Clade: Dinosauria Clade: Saurischia Clade: Theropoda Family: †Noasauridae Genus: †LaevisuchusHuene & Matley, 1933 Type species †Laevisuchus indicusHuene & Matley, 1933 Laevisuchus (/ˌlɛvɪˈsjuːkəs/...

 

 

Collection of papers about animal ethics Political Animals and Animal Politics EditorsMarcel Wissenburg and David SchlosbergSeriesPalgrave Macmillan Animal Ethics SeriesSubjectsAnimal ethics, human exceptionalism, political philosophy, political theory, environmental politics, political science, social philosophy, political communication[1]PublishedPalgrave MacmillanPublication date2014Media typeEdited collectionPagesxii+180[1]ISBN978-1-137-43461-6 Political Animals and A...

American doll brand Cabbage Patch KidsTypeDollsCompanyColeco (1982–1988)Hasbro (1988–1994)Mattel (1994–2003)Toys R Us (2003)Play Along (2004–2011)Jakks Pacific (2011–2014)Wicked Cool Toys (2015–present)CountryUnited StatesAvailability1978–presentOfficial website Cabbage Patch Kids are a line of cloth dolls with plastic heads first produced by Coleco Industries in 1982. They were inspired by the Little People soft sculptured dolls sold by Xavier Roberts as collectibles. The brand...

 

 

Osorio is a tragedy in blank verse by Samuel Taylor Coleridge. It was written in 1797 but was unperformed following its rejection by Drury Lane Theatre. Coleridge revised and recast the play sixteen years later, giving it the new title of Remorse. Remorse met with considerable critical and commercial success when it was first performed in 1813: it ran for twenty nights at Drury Lane and was issued in print three times within the year.[1] Despite the play's success, later critics dismi...

 

 

この記事の項目名には以下のような表記揺れがあります。 アヴリル・ラヴィーン アブリル・ラビーン アヴリル・ラヴィーン グラミー・ミュージアムにて(2019年)署名基本情報出生名 アヴリル・ラモーナ・ラヴィーン生誕 (1984-09-27) 1984年9月27日(39歳) カナダ・オンタリオ州ベルビル[1] ジャンル ポップ・ロック[1]オルタナティヴ・ロック[1]インディ...

Netball Superleague team Manchester ThunderNickname(s)Black and YellowsFounded2001Based inManchesterRegionsNorth West EnglandHome venueNational Basketball Performance CentreBelle Vue Sports VillageHead coachKaren GreigCaptainNat MetcalfVice-captainKerry Almond, Shadine Van Der MerweLeagueNetball SuperleagueWebsitemanchesterthunder.co.uk Uniform Manchester Thunder are an English netball team based in Manchester. Their senior team plays in the Netball Superleague. In 2005–06, Thunder were fou...

 

 

Yakovlev Yak-58 adalah sebuah pesawat kecil, multi-peran transportasi utilitas sayap rendah (low wing) dan pesawat bisnis. Pesawat ini memiliki mesin pendorong dan kembar booming ekor. Pesawat ini diproduksi terbatas di akhir 1990-an. Referensi Gordon, Yefim, Dmitry Komissarov and Sergey Komissarov. OKB Yakovlev: A History of the Design Bureau and its Aircraft. Hinkley, UK: Midland Publishing, 2005. ISBN 1-85780-203-9. Gunston, Bill and Yefim Gordon. Yakovlev Aircraft since 1924. London, UK: ...

 

 

British science-fiction drama television series PrimevalSeries 4 and 5 title cardGenreScience fictionDramaCreated by Tim Haines Adrian Hodges StarringSee List of Primeval charactersComposers Dominik Scherrer Series 1–3 James Hannigan Series 3 Angus Moncrieff Series 3 Stephen McKeon Series 4–5 Country of originUnited KingdomOriginal languageEnglishNo. of series5No. of episodes36 (list of episodes)ProductionExecutive producers Tim Haines Adrian Hodges Series 2–5 Cameron McAllister Series ...

This article has multiple issues. Please help improve it or discuss these issues on the talk page. (Learn how and when to remove these template messages) This article needs additional citations for verification. Please help improve this article by adding citations to reliable sources. Unsourced material may be challenged and removed.Find sources: Marine Drive, Mumbai – news · newspapers · books · scholar · JSTOR (October 2012) (Learn how and when to re...

 

 

Voce principale: Unione Sportiva Catanzaro. Unione Sportiva CatanzaroStagione 1965-1966 Sport calcio Squadra Catanzaro Allenatore Dino Ballacci Presidente Nicola Ceravolo Serie B10º posto Coppa ItaliaFinale Maggiori presenzeCampionato: Tonani (38) Miglior marcatoreCampionato: Bui (18) 1964-1965 1966-1967 Si invita a seguire il modello di voce Questa voce raccoglie le informazioni riguardanti l'Unione Sportiva Catanzaro nelle competizioni ufficiali della stagione 1965-1966. Indice 1 Rosa...

 

 

Strategi Solo vs Squad di Free Fire: Cara Menang Mudah!