Data Science
Cette image montre un résultat de
la bibliothèque Matplotlib Phyton.
Il montre l’humidité (en %), la température (en °C),
pression (en mb) et pluie (en mm) pour le mois
Juillet 2021 dans la ville de Spa,
mesuré toutes les 3 heures. Le darkgrey bols marque 12am nuit et le orange bols marque 12pm
midi.
Data extrait de the worldweatheronline Api Cliquez ici pour voir le data file
Cette video montre une analyse transnationale des caractéristiques sociales en corrélation avec l' espérance de vie. J’ai téléchargé les données de UNdata et NationMaster sur Power Bi. La visualisation a été acquise avec le Line chart, Pie chart, Cards et Correlation Plot Visual
La science des données est une combinaison de statistiques et d’informatique.
Les méthodes statistiques permettent d’acquérir des connaissances précises à partir de données.
De nos jours, l’analyse statistique est généralement faite avec des ordinateurs parce que cela prend
moins de temps, n’est pas sujette à des erreurs et parce que le Big Data est disponible. La
découverte des structures dans le Big Data est appelée 'Data mining'. Data mining peut être pour la
validation d’hypothèses, la découverte de connaissances, descriptive (accent sur les corrélations)
ou prédictive (accent sur les prédictions). Les données peuvent être acquises à partir d’APIs,
grattage web, d’expériences (2 groupes, changer les circonstances) ou d’observations.
Les data scientists ont besoin de connaissances informatiques, à savoir Database, Machine
Learning et les langages Python (utilisés par 57% des scientifiques) ou R + bibliothèques. Des
exemples de bibliothèques Python sont NumPy pour l’utilisation de l' array, Pandas pour l’analyse de
données, SciPy pour les calculs scientifique et Matplotlib pour le traçage graphique.
L’intelligence artificielle désigne la simulation de l’intelligence humaine (perception,
apprentissage, communication, résolution de problèmes,...). L’IA peut être (robots IA) mais n’est
pas toujours (robots industriels) intégrée dans les robots. L’apprentissage automatique est une
étape vers l’IA. Cela signifie programmer l’ordinateur pour utiliser les statistiques et apprendre
des données.