Exercice en R : Analyse des Addictions au Paracétamol chez les Plus de 80 Ans
Contexte :
Vous êtes analyste de données formé en R sur le site Pandacodeur.com, et vous devez analyser les données relatives à l'utilisation excessive du paracétamol chez les personnes de plus de 80 ans. Cette analyse vise à comprendre l'impact de cette addiction sur la perte de mémoire chez cette tranche d'âge.
Données :
# Données simulées
ages <- c(82, 85, 87, 90, 83, 86, 88, 91, 84, 89) # Âge des patients
comprime_par_semaine <- c(20, 25, 30, 35, 15, 22, 28, 40, 18, 33) # Nombre de comprimés par semaine
score_memoire <- c(55, 50, 45, 40, 60, 52, 48, 35, 58, 42) # Score de mémoire
# Création du DataFrame
df_patients <- data.frame(ages, comprime_par_semaine, score_memoire)
print(df_patients)
Questions :
1. Calcul du Nombre Total de Comprimés de Paracétamol
Question : Calculez le nombre total de comprimés de paracétamol pris par tous les patients pendant une semaine.
Indice : Utilisez la fonction sum()
sur le vecteur comprime_par_semaine
.
2. Trouver le Score de Mémoire Minimum
Question : Déterminez le score de mémoire le plus bas enregistré parmi les patients.
Indice : Utilisez la fonction min()
sur le vecteur score_memoire
.
3. Calcul de la Moyenne des Scores de Mémoire
Question : Calculez le score moyen de mémoire des patients.
Indice : Utilisez la fonction mean()
sur le vecteur score_memoire
.
4. Filtrage des Données avec dplyr
Question : Filtrez les patients qui prennent plus de 30 comprimés par semaine.
Indice : Utilisez la fonction filter()
du package dplyr
. Assurez-vous de charger le package avec library(dplyr)
.
5. Sélection des Colonnes avec dplyr
Question : Sélectionnez uniquement les colonnes ages
et score_memoire
dans le DataFrame.
Indice : Utilisez la fonction select()
du package dplyr
.
6. Création d’une Nouvelle Colonne avec dplyr
Question : Créez une nouvelle colonne indice_memoire
qui représente le score de mémoire normalisé sur une échelle de 0 à 1 (en divisant le score par 100).
Indice : Utilisez la fonction mutate()
du package dplyr
.
7. Résumé des Données avec dplyr
Question : Obtenez un résumé de la moyenne des comprimés de paracétamol pris par semaine.
Indice : Utilisez la fonction summarise()
du package dplyr
.
À la fin de cet exercice, vous devriez être capable de :
- Manipuler des vecteurs et des matrices en R.
- Utiliser les fonctions de base comme
sum()
, min()
, et mean()
pour des analyses simples.
- Manipuler des données en utilisant le package
dplyr
, y compris le filtrage, la sélection de colonnes, la création de nouvelles colonnes et le résumé des données.
Cet exercice vous aidera à développer vos compétences en analyse de données en utilisant R dans un contexte concret lié à l'impact de l'utilisation excessive de médicaments sur la mémoire.