Note

Cette page a été générée depuis tutorials/machine_learning/01_qsvm_classification.ipynb.

Exécuter en mode interactif dans le IBM Quantum lab.

QSVM (Quantum-enhanced Support Vector Machine)¶

Classification algorithms and methods for machine learning are essential for pattern recognition and data mining applications. Well known techniques such as support vector machines and neural networks have blossomed over the last two decades as a result of the spectacular advances in classical hardware computational capabilities and speed. This progress in computer power made it possible to apply techniques, that were theoretically developed towards the middle of the 20th century, on classification problems that were becoming increasingly challenging.

Un concept clé des méthodes de classification est celui de noyau. Les données ne peuvent généralement pas être séparées par un hyperplan dans son espace d’origine. Une technique commune utilisée pour trouver un tel hyperplan consiste à appliquer une fonction de transformation non linéaire aux données. Cette fonction est appelée une carte des caractéristiques, car elle transforme les caractéristiques brutes ou les propriétés mesurables, du phénomène ou du sujet à l’étude. Classification dans ce nouvel espace de fonctionnalités - et, en fait, aussi dans tout autre espace, y compris l’original - n’est rien de plus que de voir à quel point les points de données sont proches les uns des autres. C’est la même chose que de calculer le produit intérieur pour chaque paire de données dans l’ensemble. Donc, en fait, nous n’avons pas besoin de calculer la carte des fonctionnalités non linéaires pour chaque datum, mais seulement le produit intérieur de chaque paire de données dans le nouvel espace de fonctionnalité. Cette collection de produits intérieurs s’appelle le noyau et il est parfaitement possible d’avoir des cartes de fonctionnalités difficiles à calculer mais dont les noyaux ne le sont pas.

Dans ce bloc-notes nous fournissons un exemple de problème de classification qui nécessite une carte de fonctionnalités pour laquelle le calcul du noyau n’est pas efficace classiquement - ce qui signifie que les ressources de calcul requises sont censées s’adapter exponentiellement à la taille du problème. Nous montrons comment cela peut être résolu dans un processeur quantique par une estimation directe du noyau dans l’espace fonctionnel. La méthode que nous utilisons s’inscrit dans la catégorie de ce que l’on appelle l’apprentissage supervisé, consistant en une phase de formation (où le noyau est calculé et les vecteurs de support obtenus) et une phase de test ou de classification (où de nouvelles données non étiquetées sont classées en fonction de la solution trouvée dans la phase d’apprentissage).

Références et informations supplémentaires:

[1] Vojtech Havlicek, Antonio D. C´orcoles, Kristan Temme, Aram W. Harrow, Abhinav Kandala, Jerry M. Chow, and Jay M. Gambetta1, “Supervised learning with quantum enhanced feature spaces,” arXiv: 1804.11326

[1]:

import matplotlib.pyplot as plt
import numpy as np

from qiskit import BasicAer
from qiskit.circuit.library import ZZFeatureMap
from qiskit.aqua import QuantumInstance, aqua_globals
from qiskit.aqua.algorithms import QSVM
from qiskit.aqua.utils import split_dataset_to_data_and_labels, map_label_to_class_name

seed = 10599
aqua_globals.random_seed = seed

Le jeu de données ad hoc¶

As a first example we will use the ad hoc dataset as described in the above referenced paper. From the dataset we take samples for use as training, testing and the final prediction (datapoints).

[2]:

from qiskit.ml.datasets import ad_hoc_data, sample_ad_hoc_data

feature_dim = 2
sample_total, training_input, test_input, class_labels = ad_hoc_data(
    training_size=20,
    test_size=10,
    n=feature_dim,
    gap=0.3,
    plot_data=True
)
extra_test_data = sample_ad_hoc_data(sample_total, 10, n=feature_dim)
datapoints, class_to_label = split_dataset_to_data_and_labels(extra_test_data)
print(class_to_label)

../../_images/tutorials_machine_learning_01_qsvm_classification_3_0.png

{'A': 0, 'B': 1}

With the dataset ready we can setup the QSVM algorithm to do a classification. Here we use the ZZFeatureMap data encoding circuit from the Qiskit circuit library.

Here the BasicAer qasm_simulator is used with 1024 shots.

For the testing, the result includes the details and the success ratio. For the prediction, the result includes the predicted labels.

[3]:

feature_map = ZZFeatureMap(feature_dimension=feature_dim, reps=2, entanglement='linear')
qsvm = QSVM(feature_map, training_input, test_input, datapoints[0])

backend = BasicAer.get_backend('qasm_simulator')
quantum_instance = QuantumInstance(backend, shots=1024, seed_simulator=seed, seed_transpiler=seed)

result = qsvm.run(quantum_instance)

print(f'Testing success ratio: {result["testing_accuracy"]}')
print()
print('Prediction from datapoints set:')
print(f'  ground truth: {map_label_to_class_name(datapoints[1], qsvm.label_to_class)}')
print(f'  prediction:   {result["predicted_classes"]}')
predicted_labels = result["predicted_labels"]
print(f'  success rate: {100*np.count_nonzero(predicted_labels == datapoints[1])/len(predicted_labels)}%')

Testing success ratio: 1.0

Prediction from datapoints set:
  ground truth: ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B']
  prediction:   ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B']
  success rate: 100.0%

The following shows the kernel matrix that was built from the training sample of the dataset.

[4]:

kernel_matrix = result['kernel_matrix_training']
plt.imshow(np.asmatrix(kernel_matrix),interpolation='nearest',origin='upper',cmap='bone_r');

../../_images/tutorials_machine_learning_01_qsvm_classification_7_0.png

Qiskit also has a classical SVM implementation that takes the same input data for classification. Let’s run this and do a comparison. Now the ad hoc data set was created to show that there can be datasets where quantum could give an advantage.

[5]:

from qiskit.aqua.algorithms import SklearnSVM

result = SklearnSVM(training_input, test_input, datapoints[0]).run()

print(f'Testing success ratio: {result["testing_accuracy"]}')
print()
print('Prediction from datapoints set:')
print(f'  ground truth: {map_label_to_class_name(datapoints[1], qsvm.label_to_class)}')
print(f'  prediction:   {result["predicted_classes"]}')
predicted_labels = result["predicted_labels"]
print(f'  success rate: {100*np.count_nonzero(predicted_labels == datapoints[1])/len(predicted_labels)}%')

kernel_matrix = result['kernel_matrix_training']
plt.imshow(np.asmatrix(kernel_matrix), interpolation='nearest', origin='upper', cmap='bone_r');

Testing success ratio: 0.65

Prediction from datapoints set:
  ground truth: ['A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B', 'B']
  prediction:   ['B', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'A', 'A', 'A', 'B', 'B', 'B', 'A', 'B', 'A', 'B', 'B', 'A']
  success rate: 55.0%

../../_images/tutorials_machine_learning_01_qsvm_classification_9_1.png

The breast cancer dataset¶

Now we run our algorithm with a real-world dataset: the breast cancer dataset, we use the first two principal components as features.

[6]:

from qiskit.ml.datasets import breast_cancer

feature_dim = 2
sample_total, training_input, test_input, class_labels = breast_cancer(
    training_size=20,
    test_size=10,
    n=feature_dim,
    plot_data=True
)

../../_images/tutorials_machine_learning_01_qsvm_classification_11_0.png

[7]:

feature_map = ZZFeatureMap(feature_dimension=feature_dim, reps=2, entanglement='linear')
qsvm = QSVM(feature_map, training_input, test_input)

backend = BasicAer.get_backend('qasm_simulator')
quantum_instance = QuantumInstance(backend, shots=1024, seed_simulator=seed, seed_transpiler=seed)

result = qsvm.run(quantum_instance)

print(f'Testing success ratio: {result["testing_accuracy"]}')

Testing success ratio: 0.9

The kernel matrix that was built from the training sample of the dataset.

[8]:

kernel_matrix = result['kernel_matrix_training']
img = plt.imshow(np.asmatrix(kernel_matrix),interpolation='nearest',origin='upper',cmap='bone_r')

../../_images/tutorials_machine_learning_01_qsvm_classification_14_0.png

Again we are able to compare the result to a classical approach.

[9]:

result = SklearnSVM(training_input, test_input).run()

print(f'Testing success ratio: {result["testing_accuracy"]}')

kernel_matrix = result['kernel_matrix_training']
plt.imshow(np.asmatrix(kernel_matrix), interpolation='nearest', origin='upper', cmap='bone_r');

Testing success ratio: 0.85

../../_images/tutorials_machine_learning_01_qsvm_classification_16_1.png

[10]:

import qiskit.tools.jupyter
%qiskit_version_table
%qiskit_copyright

Version Information

Qiskit Software	Version
Qiskit	0.23.1
Terra	0.16.1
Aer	0.7.1
Ignis	0.5.1
Aqua	0.8.1
IBM Q Provider	0.11.1
System information
Python	3.6.1 \|Continuum Analytics, Inc.\| (default, May 11 2017, 13:09:58) [GCC 4.4.7 20120313 (Red Hat 4.4.7-1)]
OS	Linux
CPUs	1
Memory (Gb)	5.827335357666016
Fri Nov 13 15:24:51 2020 EST

This code is a part of Qiskit

This code is licensed under the Apache License, Version 2.0. You may
obtain a copy of this license in the LICENSE.txt file in the root directory
of this source tree or at http://www.apache.org/licenses/LICENSE-2.0.

Any modifications or derivative works of this code must retain this
copyright notice, and modified files need to carry a notice indicating
that they have been altered from the originals.

[ ]: