# Chapitre 6 - Différentes utilisations du machine learning avec Python (4ème partie)

## 6.7 Le deep learning avec Keras

### 6.7.2 Principe d’un réseau de neurone et première utilisation avec Keras

Le package Keras que nous avons installé est basé sur une structure extrêmement
simple à mettre en oeuvre. On commence par définir le type de réseau utilisé. Dans
cet ouvrage, il s’agira de réseaux séquentiels.

Si nous prenons les données sur les télécommunications que nous avons utilisées
précédemment, nous pouvons simplement utiliser Keras pour créer un réseau de neurones assez évolué (on suppose ici que les données ont été préparées comme
dans la première partie de ce chapitre avec Scikit-Learn) :

In [1]:
import pandas as pd
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.layers import BatchNormalization, Activation

In [2]:
x=pd.read_csv("../data/x_telecom.csv",index_col=0)
y=pd.read_csv("../data/y_telecom.csv",index_col=0)

In [3]:
from sklearn.model_selection import train_test_split
# on sépare nos données en apprentissage/validation avec Scikit-Learn
x_train, x_test, y_train, y_test=train_test_split(x,y,test_size=0.2)

In [4]:
# on crée le modèle
model = Sequential()

In [5]:
# on ajoute des couches avec des fonctions d’activation

model.add(Dense(50, input_shape=(21,)))
model.add(Activation("relu"))
# cette couche permet de normaliser les données
model.add(BatchNormalization())
# cette couche va faire en sorte d’éviter l’overfitting
model.add(Dropout(0.1))
# on ajoute un autre groupe de couches
model.add(Dense(10))
model.add(Activation("relu"))
model.add(BatchNormalization())
model.add(Dropout(0.1))
# on ajoute la couche de sortie
model.add(Dense(1))
model.add(Activation('sigmoid'))


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


In [6]:
# on définit la fonction de perte et la fonction d’optiimsation
model.compile(loss='binary_crossentropy', optimizer='adam', metrics=["accuracy"])

In [7]:
# on ajuste le modèle
model.fit(x_train, y_train, batch_size=100, epochs=100)

Epoch 1/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2ms/step - accuracy: 0.5067 - loss: 0.8147
Epoch 2/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.6276 - loss: 0.6565 
Epoch 3/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.7225 - loss: 0.5748 
Epoch 4/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.7666 - loss: 0.5423 
Epoch 5/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.8113 - loss: 0.4808 
Epoch 6/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.8426 - loss: 0.4454 
Epoch 7/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.8707 - loss: 0.4045 
Epoch 8/100
[1m27/27[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 1ms/step - accuracy: 0.8787 - loss: 0.3742 
Epoch 9/100
[1m27/27[0m [32m━━━━━━━━━━

<keras.src.callbacks.history.History at 0x269166097c0>

In [8]:
model.predict(x_test)

[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3ms/step


array([[1.08628444e-01],
       [1.26129771e-02],
       [4.66779759e-03],
       [7.27546662e-02],
       [3.96000687e-03],
       [3.16638537e-02],
       [2.14160588e-02],
       [2.75239404e-02],
       [1.76696072e-03],
       [1.96381006e-03],
       [1.12803550e-02],
       [2.05785222e-02],
       [8.72267701e-04],
       [9.23434738e-03],
       [2.11154316e-02],
       [9.19602998e-03],
       [1.69141591e-02],
       [4.21361960e-02],
       [1.46912662e-02],
       [6.62710052e-03],
       [8.14505760e-03],
       [2.15774179e-02],
       [2.18369160e-02],
       [1.89744681e-02],
       [2.51232125e-02],
       [2.05599871e-02],
       [2.33918186e-02],
       [9.68107209e-03],
       [7.25798635e-03],
       [3.58934863e-03],
       [9.67160892e-03],
       [6.33288920e-02],
       [4.63237101e-03],
       [2.72004213e-02],
       [9.64996591e-03],
       [1.57859456e-02],
       [2.79434249e-02],
       [9.84488148e-03],
       [2.17328444e-01],
       [6.99033029e-03],


In [9]:
# on calcule l’AUC pour les données de validation
from sklearn.metrics import roc_auc_score
print("AUC pour RN :", roc_auc_score(y_test,
                                     model.predict(x_test).reshape(-1)))

[1m21/21[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 2ms/step 
AUC pour RN : 0.9234279321714555


Les réseaux de neurones sont des méthodes extrêmement efficaces à condition
de bien les paramétrer ce qui peut s‘avérer très difficile.

### 6.7.3 Le deep learning et les réseaux de neurones à convolutions

On va maintenant travailler sur des images. On prendra les données fashion-mnist :

In [10]:
from tensorflow.keras.utils import to_categorical
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout, Activation, Flatten
from tensorflow.keras.layers import Conv2D, MaxPool2D
from tensorflow.keras.datasets import fashion_mnist

In [11]:
# récupération des données
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

# les données sont transformées pour passer sous un format d’image
# standard avec des valeurs entre 0 et 1
x_train = (x_train/255).reshape(x_train.shape[0], 28, 28,1)
x_test = (x_test/255).reshape(x_test.shape[0], 28, 28,1)

# passage à 10 colonnes pour y(une par modalité)
y_train = to_categorical(y_train, 10)
y_test = to_categorical(y_test, 10)

In [12]:
# construction du modèle
model = Sequential()
model.add(Conv2D(32, (3, 3), activation = 'relu', input_shape = (28,28,1)))
model.add(Conv2D(32, (3, 3), activation = 'relu'))
model.add(MaxPool2D(pool_size=(2,2)))
model.add(Dropout(0.25))
model.add(Flatten())
model.add(Dense(128, activation='relu'))
model.add(Dropout(0.5))
model.add(Dense(10, activation='softmax'))

  super().__init__(


In [13]:
# compilation du modèle
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

In [14]:
# ajustement du modèle
model.fit(x_train, y_train, batch_size=100, epochs=10, verbose=1)

Epoch 1/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m8s[0m 10ms/step - accuracy: 0.7407 - loss: 0.7360
Epoch 2/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 10ms/step - accuracy: 0.8714 - loss: 0.3572
Epoch 3/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 10ms/step - accuracy: 0.8898 - loss: 0.3104
Epoch 4/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 15ms/step - accuracy: 0.8976 - loss: 0.2785
Epoch 5/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 15ms/step - accuracy: 0.9058 - loss: 0.2556
Epoch 6/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m9s[0m 16ms/step - accuracy: 0.9129 - loss: 0.2385
Epoch 7/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 16ms/step - accuracy: 0.9194 - loss: 0.2173
Epoch 8/10
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 16ms/step - accuracy: 0.9242 - loss: 0.2065
Epoch 9/10
[1m600/600[0m [3

<keras.src.callbacks.history.History at 0x26917b046b0>

In [15]:
# evaluation du modèle
score = model.evaluate(x_test, y_test, verbose=0)

Nous avons appliqué deux couches de convolutions à 32 neurones avec une taille
de fenêtre de 3 par 3. Puis une couche de pooling avec une réduction sur des fenêtres
de 2 par 2. Nous obtenons les résultats suivants :

In [16]:
# obtention de l’accuracy sur les données de validation
print("Pourcentage de bien classées :", score[1])

Pourcentage de bien classées : 0.9212999939918518


On voit qu’on est au-delà de 92 % bien classés sur l’échantillon de validation.
Dans notre cas, on a utilisé des images directement dans le package Keras.

Généralement, les images sont stockées dans des répertoires différents. Keras
possède de nombreux outils pour charger ces images, on peut par exemple utiliser
ImageDataGenerator :

In [17]:
from tensorflow.keras.preprocessing.image import ImageDataGenerator

# on définit un générateur qui pourrait modifier nos images
# (dans ce cas on passe en float 0 à 1)
train_datagen = ImageDataGenerator(rescale=1./255)
test_datagen = ImageDataGenerator(rescale=1./255)

# on définit le dossier dans lequel se trouve les images
train_generator = train_datagen.flow_from_directory('../data/',target_size=(150, 150),
                                                    batch_size=32,class_mode='binary')
# on définit le dossier dans lequel se trouve les images
validation_generator = test_datagen.flow_from_directory('../data/',
                                                        target_size=(150, 150),
                                                        batch_size=32,
                                                        class_mode='binary')

Found 0 images belonging to 0 classes.
Found 0 images belonging to 0 classes.


Vous avez maintenant tous les outils pour vous lancer dans la construction de
réseaux de deep learning avec Python.

### 6.7.4 Aller plus loin : génération de features, transfer learning, RN, GAN …
On charge facilement un modèle avec :

In [18]:
from tensorflow.keras.applications.resnet50 import ResNet50
from tensorflow.keras.preprocessing import image
from tensorflow.keras.applications.resnet50 import preprocess_input
from tensorflow.keras.applications.resnet50 import decode_predictions
import numpy as np

In [19]:
# on utilise le modèle ResNet50
model = ResNet50(weights='imagenet')

In [20]:
# on récupère une nouvelle image
img_path = '../data/elephant.png'
img = image.load_img(img_path, target_size=(224, 224))
x = image.img_to_array(img)
x = np.expand_dims(x, axis=0)
x = preprocess_input(x)

In [21]:
# on applique le modèle
preds = model.predict(x)
print('Prédit (classe/ %):', decode_predictions(preds, top=1)[0])

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2s/step
Prédit (classe/ %): [('n02504458', 'African_elephant', 0.6474553)]


On obtient donc un résultat à partir du modèle chargé. On pourra utiliser ce modèle
et ses poids dans des couches intermédiaires de notre modèle.

Dans ce cas, on a chargé un modèle et on lui a fourni une photographie d’éléphant.
Le modèle considère que c’est un éléphant d’Afrique à 87%.

### Les modèles de langages et le principe de l’attention

Les modèles de langages (LLM) sont aujourd'hui centraux dans le cadre de l'IA. 

Python par l'intermédiaire du package transformers de Hugging-Face permet de charger et d'appliquer ce type de modèle. En voici un exemple rapide avec le modèle GPT2.

In [22]:
# on importe les classes
from transformers import GPT2LMHeadModel , GPT2Tokenizer 
# on charge le modèle de tokenizer
tokenizer = GPT2Tokenizer.from_pretrained('gpt2') 
# on crée le modèle de langage à partir de GPT2
model = GPT2LMHeadModel.from_pretrained('gpt2' , 
                        pad_token_id = tokenizer.eos_token_id)
# on crée l'input
question = 'What is python?' 
# on encode l'input grâce au tokenizer
input_ids = tokenizer.encode(question, return_tensors='pt') 
# on génère l'output grâce au modèle
output = model.generate(input_ids, 
                        max_length = 1000, 
                        num_beams = 5,
                        no_repeat_ngram_size = 2,
                        early_stopping = True
                       )
# on affiche la sortie
print(tokenizer.decode(output[0], skip_special_tokens=True )) 

What is python?

Python is a programming language that allows you to write code that runs on top of other languages. It's a great way to learn about programming languages and how they can be used in your own projects. You can learn more about Python at http://pypi.python.org/wiki/Python.


De nombreuses applications sont disponibles notamment en utilisant les modèles de Hugging Face et les API des différents modèles.

Le développement de ces approches nécessaiterait un second ouvrage.


Nous avons effectué un panorama approfondi de l’utilisation de Python
pour faire du machine learning, du deep learning et du traitement des
données textuelles. Python ressort comme un langage adapté à toutes
ces approches et un outil indispensable pour le data scientist.