3. Modèle de données¶
3.1. Objets, valeurs et types¶
En Python, les données sont représentées sous forme d’objets. Toutes les données d’un programme Python sont représentées par des objets ou par des relations entre les objets (dans un certain sens, et en conformité avec le modèle de Von Neumann d”« ordinateur à programme enregistré », le code est aussi représenté par des objets).
Chaque objet possède un identifiant, un type et une valeur. L’identifiant d’un objet ne change jamais après sa création ; vous pouvez vous le représenter comme l’adresse de l’objet en mémoire. L’opérateur is
compare les identifiants de deux objets ; la fonction id()
renvoie un entier représentant cet identifiant.
CPython implementation detail: en CPython, id(x)
est l’adresse mémoire où est stocké x
.
Le type de l’objet détermine les opérations que l’on peut appliquer à l’objet (par exemple, « a-t-il une longueur ? ») et définit aussi les valeurs possibles pour les objets de ce type. La fonction type()
renvoie le type de l’objet (qui est lui-même un objet). Comme l’identifiant, le type d’un objet ne peut pas être modifié 1.
La valeur de certains objets peut changer. Les objets dont la valeur peut changer sont dits muables (mutable en anglais) ; les objets dont la valeur est définitivement fixée à leur création sont dits immuables (immutable en anglais). La valeur d’un objet conteneur immuable qui contient une référence vers un objet muable peut varier lorsque la valeur de l’objet muable change ; cependant, le conteneur est quand même considéré comme immuable parce que l’ensemble des objets qu’il contient ne peut pas être modifié. Ainsi, l’immuabilité n’est pas strictement équivalente au fait d’avoir une valeur non modifiable, c’est plus subtil. La muabilité d’un objet est définie par son type ; par exemple, les nombres, les chaînes de caractères et les tuples sont immuables alors que les dictionnaires et les listes sont muables.
Un objet n’est jamais explicitement détruit ; cependant, lorsqu’il ne peut plus être atteint, il a vocation à être supprimé par le ramasse-miettes (garbage-collector en anglais). L’implémentation peut retarder cette opération ou même ne pas la faire du tout — la façon dont fonctionne le ramasse-miette est particulière à chaque implémentation, l’important étant qu’il ne supprime pas d’objet qui peut encore être atteint.
CPython implementation detail: CPython utilise aujourd’hui un mécanisme de compteur de références avec une détection, en temps différé et optionnelle, des cycles d’objets. Ce mécanisme supprime la plupart des objets dès qu’ils ne sont plus accessibles mais il ne garantit pas la suppression des objets où il existe des références circulaires. Consultez la documentation du module gc
pour tout ce qui concerne la suppression des cycles. D’autres implémentations agissent différemment et CPython pourrait évoluer. Ne vous reposez pas sur la finalisation immédiate des objets devenus inaccessibles (ainsi, vous devez toujours fermer les fichiers explicitement).
Notez que si vous utilisez les fonctionnalités de débogage ou de trace de l’implémentation, il est possible que des références qui seraient normalement supprimées soient toujours présentes. Notez aussi que capturer une exception avec l’instruction try
…except
peut conserver des objets en vie.
Certains objets font référence à des ressources « externes » telles que des fichiers ouverts ou des fenêtres. Ces objets libèrent ces ressources au moment où ils sont supprimés, mais comme le ramasse-miettes ne garantit pas qu’il supprime tous les objets, ces objets fournissent également un moyen explicite de libérer la ressource externe, généralement sous la forme d’une méthode close()
. Nous incitons fortement les programmeurs à fermer explicitement de tels objets. Les instructions try
…finally
et with
sont très pratiques pour cela.
Certains objets contiennent des références à d’autres objets ; on les appelle conteneurs. Comme exemples de conteneurs, nous pouvons citer les tuples, les listes et les dictionnaires. Les références sont parties intégrantes de la valeur d’un conteneur. Dans la plupart des cas, lorsque nous parlons de la valeur d’un conteneur, nous parlons des valeurs, pas des identifiants des objets contenus ; cependant, lorsque nous parlons de la muabilité d’un conteneur, seuls les identifiants des objets immédiatement contenus sont concernés. Ainsi, si un conteneur immuable (comme un tuple) contient une référence à un objet muable, sa valeur change si cet objet muable est modifié.
Presque tous les comportements d’un objet dépendent du type de l’objet. Même son identifiant est concerné dans un certain sens : pour les types immuables, les opérations qui calculent de nouvelles valeurs peuvent en fait renvoyer une référence à n’importe quel objet existant avec le même type et la même valeur, alors que pour les objets muables cela n’est pas autorisé. Par exemple, après a = 1 ; b = 1
, a
et b
peuvent ou non se référer au même objet avec la valeur un, en fonction de l’implémentation. Mais après c = [] ; d = []
, il est garanti que c
et d
font référence à deux listes vides distinctes nouvellement créées. Notez que c = d = []
attribue le même objet à c
et d
.
3.2. Hiérarchie des types standards¶
Vous trouvez ci-dessous une liste des types natifs de Python. Des modules d’extension (écrits en C, Java ou d’autres langages) peuvent définir des types supplémentaires. Les futures versions de Python pourront ajouter des types à cette hiérarchie (par exemple les nombres rationnels, des tableaux d’entiers stockés efficacement, etc.), bien que de tels ajouts se trouvent souvent plutôt dans la bibliothèque standard.
Quelques descriptions des types ci-dessous contiennent un paragraphe listant des « attributs spéciaux ». Ces attributs donnent accès à l’implémentation et n’ont, en général, pas vocation à être utilisés. Leur définition peut changer dans le futur.
None
Ce type ne possède qu’une seule valeur. Il n’existe qu’un seul objet avec cette valeur. Vous accédez à cet objet avec le nom natif
None
. Il est utilisé pour signifier l’absence de valeur dans de nombreux cas, par exemple pour des fonctions qui ne retournent rien explicitement. Sa valeur booléenne est fausse.- NotImplemented
Ce type ne possède qu’une seule valeur. Il n’existe qu’un seul objet avec cette valeur. Vous accédez à cet objet avec le nom natif
NotImplemented
. Les méthodes numériques et les comparaisons riches doivent renvoyer cette valeur si elles n’implémentent pas l’opération pour les opérandes fournis (l’interpréteur essaie alors l’opération en permutant les opérandes ou tout autre stratégie de contournement, en fonction de l’opérateur). Sa valeur booléenne est vraie.Consultez Implémentation des opérations arithmétiques pour davantage de détails.
- Ellipse
Ce type ne possède qu’une seule valeur. Il n’existe qu’un seul objet avec cette valeur. Vous accédez à cet objet avec le littéral
...
ou le nom natifEllipsis
. Sa valeur booléenne est vraie.numbers.Number
Ces objets sont créés par les littéraux numériques et renvoyés en tant que résultats par les opérateurs et les fonctions arithmétiques natives. Les objets numériques sont immuables ; une fois créés, leur valeur ne change pas. Les nombres Python sont bien sûr très fortement corrélés aux nombres mathématiques mais ils sont soumis aux limitations des représentations numériques par les ordinateurs.
Python distingue les entiers, les nombres à virgule flottante et les nombres complexes :
numbers.Integral
Ils représentent des éléments de l’ensemble mathématique des entiers (positifs ou négatifs).
Il existe deux types d’entiers :
Entiers (
int
)Ils représentent les nombres, sans limite de taille, sous réserve de pouvoir être stockés en mémoire (virtuelle). Afin de pouvoir effectuer des décalages et appliquer des masques, on considère qu’ils ont une représentation binaire. Les nombres négatifs sont représentés comme une variante du complément à 2, qui donne l’illusion d’une chaîne infinie de bits de signe s’étendant vers la gauche.
- Booléens (
bool
) Ils représentent les valeurs faux et vrai. Deux objets,
False
etTrue
, sont les seuls objets booléens. Le type booléen est un sous-type du type entier et les valeurs booléennes se comportent comme les valeurs 0 (pourFalse
) et 1 (pourTrue
) dans presque tous les contextes. L’exception concerne la conversion en chaîne de caractères où"False"
et"True"
sont renvoyées.
Les règles pour la représentation des entiers ont pour objet de donner l’interprétation la plus naturelle pour les opérations de décalage et masquage qui impliquent des entiers négatifs.
- Booléens (
numbers.Real
(float
)Ils représentent les nombres à virgule flottante en double précision, tels que manipulés directement par la machine. Vous dépendez donc de l’architecture machine sous-jacente (et de l’implémentation C ou Java) pour les intervalles gérés et le traitement des débordements. Python ne gère pas les nombres à virgule flottante en précision simple ; les gains en puissance de calcul et mémoire, qui sont généralement la raison de l’utilisation des nombres en simple précision, sont annihilés par le fait que Python encapsule de toute façon ces nombres dans des objets. Il n’y a donc aucune raison de compliquer le langage avec deux types de nombres à virgule flottante.
numbers.Complex
(complex
)Ils représentent les nombres complexes, sous la forme d’un couple de nombres à virgule flottante en double précision, tels que manipulés directement par la machine. Les mêmes restrictions s’appliquent que pour les nombres à virgule flottante. La partie réelle et la partie imaginaire d’un nombre complexe
z
peuvent être demandées par les attributs en lecture seulez.real
etz.imag
.
- Séquences
Ils représentent des ensembles de taille finie indicés par des entiers positifs ou nuls. La fonction native
len()
renvoie le nombre d’éléments de la séquence. Quand la longueur d’une séquence est n, l’ensemble des indices contient les entiers 0, 1 …, n-1. On accède à l’élément d’indice i de la séquence a para[i]
.Les séquences peuvent aussi être découpées en tranches (slicing en anglais) :
a[i:j]
sélectionne tous les éléments d’indice k tel que i<=
k<
j. Quand on l’utilise dans une expression, la tranche est du même type que la séquence. Ceci veut dire que l’ensemble des indices de la tranche est renuméroté de manière à partir de 0.Quelques séquences gèrent le « découpage étendu » (extended slicing en anglais) avec un troisième paramètre :
a[i:j:k]
sélectionne tous les éléments de a d’indice x oùx = i + n*k
, avec n>=
0
et i<=
x<
j.Les séquences se différencient en fonction de leur muabilité :
- Séquences immuables
Un objet de type de séquence immuable ne peut pas être modifié une fois qu’il a été créé. Si l’objet contient des références à d’autres objets, ces autres objets peuvent être muables et peuvent être modifiés ; cependant, les objets directement référencés par un objet immuable ne peuvent pas être modifiés.
Les types suivants sont des séquences immuables :
- Chaînes de caractères
Une chaîne de caractères (string en anglais) est une séquence de valeurs qui représentent des caractères Unicode. Tout caractère dont le code est dans l’intervalle
U+0000 - U+10FFFF
peut être représenté dans une chaîne. Python ne possède pas de typechar
; à la place, chaque caractère Unicode dans la chaîne est représenté par un objet chaîne de longueur1
. La fonction nativeord()
convertit un caractère Unicode de la représentation en chaîne vers un entier dans l’intervalle0 - 10FFFF
; la fonctionchr()
convertit un entier de l’intervalle0 - 10FFFF
vers l’objet chaîne de longueur1
correspondant.str.encode()
peut être utilisée pour convertir un objetstr
versbytes
selon l’encodage spécifié etbytes.decode()
effectue l’opération inverse.- n-uplets (ou tuples)
Les éléments d’un tuple sont n’importe quels objets Python. Les tuples de deux ou plus éléments sont formés par une liste d’expressions dont les éléments sont séparés par des virgules. Un tuple composé d’un seul élément (un « singleton ») est formé en suffixant une expression avec une virgule (une expression en tant que telle ne crée pas un tuple car les parenthèses doivent rester disponibles pour grouper les expressions). Un tuple vide peut être formé à l’aide d’une paire de parenthèses vide.
- Bytes
Les objets bytes sont des tableaux immuables. Les éléments sont des octets (donc composés de 8 bits), représentés par des entiers dans l’intervalle 0 à 255 inclus. Les littéraux bytes (tels que
b'abc'
) et la fonction native constructeurbytes()
peuvent être utilisés pour créer des objets bytes. Aussi, un objet bytes peut être décodé vers une chaîne via la méthodedecode()
.
- Séquences muables
Les séquences muables peuvent être modifiées après leur création. Les notations de tranches et de sous-ensembles peuvent être utilisées en tant que cibles d’une assignation ou de l’instruction
del
(suppression).Il existe aujourd’hui deux types intrinsèques de séquences muables :
- Listes
N’importe quel objet Python peut être élément d’une liste. Les listes sont créées en plaçant entre crochets une liste d’expressions dont les éléments sont séparés par des virgules (notez que les listes de longueur 0 ou 1 ne sont pas des cas particuliers).
- Tableaux d’octets
Un objet bytearray est un tableau muable. Il est créé par la fonction native constructeur
bytearray()
. À part la propriété d’être muable (et donc de ne pas pouvoir calculer son empreinte par hachage), un tableau d’octets possède la même interface et les mêmes fonctionnalités qu’un objet immuablebytes
.
Le module d’extension
array
fournit un autre exemple de type de séquence muable, de même que le modulecollections
.
- Ensembles
Ils représentent les ensembles d’objets, non ordonnés, finis et dont les éléments sont uniques. Tels quels, ils ne peuvent pas être indicés. Cependant, il est possible d’itérer dessus et la fonction native
len()
renvoie le nombre d’éléments de l’ensemble. Les utilisations classiques des ensembles sont les tests d’appartenance rapides, la suppression de doublons dans une séquence et le calcul d’opérations mathématiques telles que l’intersection, l’union, la différence et le complémentaire.Pour les éléments des ensembles, les mêmes règles concernant l’immuabilité s’appliquent que pour les clés de dictionnaires. Notez que les types numériques obéissent aux règles normales pour les comparaisons numériques : si deux nombres sont égaux (pour l’opération de comparaison, par exemple
1
et1.0
), un seul élément est conservé dans l’ensemble.Actuellement, il existe deux types d’ensembles natifs :
- Ensembles
Ils représentent les ensembles muables. Un ensemble est créé par la fonction native constructeur
set()
et peut être modifié par la suite à l’aide de différentes méthodes, par exempleadd()
.- Ensembles gelés
Ils représentent les ensembles immuables. Ils sont créés par la fonction native constructeur
frozenset()
. Comme un ensemble gelé est immuable et hachable, il peut être utilisé comme élément d’un autre ensemble ou comme clé de dictionnaire.
- Tableaux de correspondances
Ils représentent les ensembles finis d’objets indicés par des ensembles index arbitraires. La notation
a[k]
sélectionne l’élément indicé park
dans le tableau de correspondancea
; elle peut être utilisée dans des expressions, comme cible d’une assignation ou avec l’instructiondel
. La fonction nativelen()
renvoie le nombre d’éléments du tableau de correspondances.Il n’existe actuellement qu’un seul type natif pour les tableaux de correspondances :
- Dictionnaires
Ils représentent les ensembles finis d’objets indicés par des valeurs presque arbitraires. Les seuls types de valeurs non reconnus comme clés sont les valeurs contenant des listes, des dictionnaires ou les autres types muables qui sont comparés par valeur plutôt que par l’identifiant de l’objet. La raison de cette limitation est qu’une implémentation efficace de dictionnaire requiert que l’empreinte par hachage des clés reste constante dans le temps. Les types numériques obéissent aux règles normales pour les comparaisons numériques : si deux nombres sont égaux pour l’opération de comparaison, par exemple
1
et1.0
, alors ces deux nombres peuvent être utilisés indifféremment pour désigner la même entrée du dictionnaire.Les dictionnaires sont muables : ils peuvent être créés par la notation
{...}
(reportez-vous à la section Agencements de dictionnaires).Les modules d’extensions
dbm.ndbm
etdbm.gnu
apportent d’autres exemples de types tableaux de correspondances, de même que le modulecollections
.
- Types appelables
Ce sont les types sur lesquels on peut faire un appel de fonction (lisez la section Appels) :
- Fonctions allogènes
Un objet fonction allogène (ou fonction définie par l’utilisateur, mais ce n’est pas forcément l’utilisateur courant qui a défini cette fonction) est créé par la définition d’une fonction (voir la section Définition de fonctions). Il doit être appelé avec une liste d’arguments contenant le même nombre d’éléments que la liste des paramètres formels de la fonction.
Attributs spéciaux :
Attribut
Signification
__doc__
Chaîne de documentation de la fonction ou
None
s’il n’en existe pas ; n’est pas héritée par les sous-classesAccessible en écriture
Nom de la fonction
Accessible en écriture
qualified name de la fonction
Nouveau dans la version 3.3.
Accessible en écriture
__module__
Nom du module où la fonction est définie ou
None
si ce nom n’est pas disponible.Accessible en écriture
__defaults__
Tuple contenant les valeurs des arguments par défaut pour ceux qui en sont dotés ou
None
si aucun argument n’a de valeur par défaut.Accessible en écriture
__code__
Objet code représentant le corps de la fonction compilée.
Accessible en écriture
__globals__
Référence pointant vers le dictionnaire contenant les variables globales de la fonction — l’espace de noms global du module dans lequel la fonction est définie.
Accessible en lecture seule
Espace de nommage accueillant les attributs de la fonction.
Accessible en écriture
__closure__
None
ou tuple de cellules qui contient un lien pour chaque variable libre de la fonction.Accessible en lecture seule
__annotations__
Dictionnaire contenant les annotations des paramètres. Les clés du dictionnaire sont les noms des paramètres et la clé
"return"
est utilisée pour les annotations de la valeur renvoyée. Les entrées du dictionnaire ne sont présentes que si les paramètres sont effectivement annotés.Accessible en écriture
__kwdefaults__
Dictionnaire contenant les valeurs par défaut pour les paramètres passés par mot-clé.
Accessible en écriture
La plupart des attributs étiquetés « Accessible en écriture » vérifient le type de la valeur qu’on leur assigne.
Les objets fonctions acceptent également l’assignation et la lecture d’attributs arbitraires. Vous pouvez utiliser cette fonctionnalité pour, par exemple, associer des métadonnées aux fonctions. La notation classique par point est utilisée pour définir et lire de tels attributs. Notez que l’implémentation actuelle accepte seulement les attributs de fonction sur les fonctions définies par l’utilisateur. Les attributs de fonction pour les fonctions natives seront peut-être acceptés dans le futur.
Vous trouvez davantage d’informations sur la définition de fonctions dans le code de cet objet ; la description des types internes est donnée plus bas.
- Méthodes d’instances
Un objet méthode d’instance combine une classe, une instance de classe et tout objet appelable (normalement une fonction définie par l’utilisateur).
Attributs spéciaux en lecture seule :
__self__
est l’objet instance de classe,__func__
est l’objet fonction ;__doc__
est la documentation de la méthode (comme__func__.__doc__
) ;__name__
est le nom de la méthode (comme__func__.__name__
) ;__module__
est le nom du module où la méthode est définie ouNone
s’il n’est pas disponible.Les méthodes savent aussi accéder (mais pas modifier) les attributs de la fonction de l’objet fonction sous-jacent.
Les objets méthodes définies par l’utilisateur peuvent être créés quand vous récupérez un attribut de classe (par exemple via une instance de cette classe) si cet attribut est un objet fonction définie par l’utilisateur ou un objet méthode de classe.
Quand un objet méthode d’instance est créé à partir d’un objet fonction définie par l’utilisateur via une des instances, son attribut
__self__
est l’instance et l’objet méthode est réputé lié. Le nouvel attribut de la méthode__func__
est l’objet fonction original.Quand un objet méthode définie par l’utilisateur est créé à partir d’un autre objet méthode de la classe ou de l’instance, son comportement est identique à l’objet fonction sauf pour l’attribut
__func__
de la nouvelle instance qui n’est pas l’objet méthode original mais son attribut__func__
.Quand un objet méthode d’instance est créé à partir d’un autre objet méthode de la classe ou de l’instance, son attribut
__self__
est la classe elle-même et son attribut__func__
est l’objet fonction sous-jacent la méthode de classe.Quand un objet méthode d’instance est appelé, la fonction sous-jacente (
__func__
) est appelée et l’objet instance de la classe (__self__
) est inséré en tête de liste des arguments. Par exemple, siC
est une classe qui contient la définition d’une fonctionf()
et quex
est une instance deC
, alors appelerx.f(1)
est équivalent à appelerC.f(x, 1)
.Quand un objet méthode d’instance est dérivé à partir d’un objet méthode de classe, l’instance de classe stockée dans
__self__
est en fait la classe elle-même. Ainsi, appelerx.f(1)
ouC.f(1)
est équivalent à appelerf(C, 1)
oùf
est la fonction sous-jacente.Notez que la transformation d’objet fonction en objet méthode d’instance se produit à chaque fois que l’attribut est récupéré à partir de l’instance. Dans certains cas, assigner l’attribut à une variable locale et appeler cette variable locale constitue une bonne optimisation. Notez aussi que cette transformation n’a lieu que pour les fonctions définies par l’utilisateur : les autres objets appelables (et les objets non appelables) sont récupérés sans transformation. Il est aussi important de noter que les fonctions définies par l’utilisateur qui sont attributs d’une instance de classe ne sont pas converties en méthodes liées ; ceci n’a lieu que pour les fonctions qui sont attributs de la classe.
- Fonctions générateurs
Une fonction ou une méthode qui utilise l’instruction
yield
(voir la section L’instruction yield) est appelée fonction générateur. Une telle fonction, lorsqu’elle est appelée, retourne toujours un objet itérateur qui peut être utilisé pour exécuter le corps de la fonction : appeler la méthodeiterator.__next__()
de l’itérateur exécute la fonction jusqu’à ce qu’elle renvoie une valeur à l’aide de l’instructionyield
. Quand la fonction exécute l’instructionreturn
ou se termine, une exceptionStopIteration
est levée et l’itérateur a atteint la fin de l’ensemble de valeurs qu’il peut renvoyer.- Fonctions coroutines
Une fonction ou méthode définie en utilisant
async def
est appelée fonction coroutine. Une telle fonction, quand elle est appelée, renvoie un objet coroutine. Elle peut contenir des expressionsawait
ouasync with
ou des instructionsasync for
. Voir également la section Objets coroutines.- Fonctions générateurs asynchrones
Une fonction ou une méthode définie avec
async def
et qui utilise l’instructionyield
est appelée fonction générateur asynchrone. Une telle fonction, quand elle est appelée, renvoie un objet itérateur asynchrone qui peut être utilisé dans des instructionsasync for
pour exécuter le corps de la fonction.Appeler la méthode
aiterator.__anext__()
de l’itérateur asynchrone renvoie un awaitable qui, lorsqu’on l’attend, s’exécute jusqu’à ce qu’il fournisse une valeur à l’aide de l’expressionyield
. Quand la fonction exécute une instructionreturn
(sans valeur) ou arrive à la fin, une exceptionStopAsynciteration
est levée et l’itérateur asynchrone a atteint la fin de l’ensemble des valeurs qu’il peut produire.- Fonctions natives
Un objet fonction native est une enveloppe autour d’une fonction C. Nous pouvons citer
len()
etmath.sin()
(math
est un module standard natif) comme fonctions natives. Le nombre et le type des arguments sont déterminés par la fonction C. Des attributs spéciaux en lecture seule existent :__doc__
contient la chaîne de documentation de la fonction (ouNone
s’il n’y en a pas) ;__name__
est le nom de la fonction ;__self__
est défini àNone
;__module__
est le nom du module où la fonction est définie ouNone
s’il n’est pas disponible.- Méthodes natives
Ce sont des fonctions natives déguisées, contenant un objet passé à une fonction C en tant qu’argument supplémentaire implicite. Un exemple de méthode native est
une_liste.append()
(une_liste
étant un objet liste). Dans ce cas, l’attribut spécial en lecture seule__self__
est défini à l’objet une_liste.- Classes
Les classes sont des appelables. Ces objets sont normalement utilisés pour créer des instances d’elles-mêmes mais des variations sont possibles pour les types de classes qui surchargent
__new__()
. Les arguments de l’appel sont passés à__new__()
et, dans le cas classique,__new__()
initialise une nouvelle instance.- Instances de classe
Les instances d’une classe peuvent devenir des appelables si vous définissez la méthode
__call__()
de leur classe.
- Modules
Les modules constituent l’organisation de base du code Python et sont créés par le mécanisme d’import soit avec l’instruction
import
(voirimport
), soit en appelant des fonctions telles queimportlib.import_module()
ou la fonction native__import__()
. Un objet module possède un espace de noms implémenté par un objet dictionnaire (c’est le dictionnaire référencé par l’attribut__globals__
des fonctions définies dans le module). Les références à un attribut sont traduites en recherches dans ce dictionnaire, par exemplem.x
est équivalent àm.__dict__["x"]
. Un objet module ne contient pas l’objet code utilisé pour initialiser le module (puisque celui-ci n’est plus nécessaire une fois l’initialisation terminée).L’assignation d’un attribut met à jour le dictionnaire d’espace de nommage du module, par exemple
m.x = 1
est équivalent àm.__dict__["x"] = 1
.Attributs prédéfinis (en lecture-écriture) :
__name__
est le nom du module ;__doc__
est la chaîne de documentation du module (ouNone
s’il n’y en a pas) ;__annotations__
(optionnel) est un dictionnaire contenant les annotations de variables collectées durant l’exécution du corps du module ;__file__
est le chemin vers le fichier à partir duquel le module a été chargé, s’il a été chargé depuis un fichier. L’attribut__file__
peut être manquant pour certains types de modules, tels que les modules C qui sont statiquement liés à l’interpréteur ; pour les modules d’extension chargés dynamiquement à partir d’une bibliothèque partagée, c’est le chemin vers le fichier de la bibliothèque partagée.Attribut spécial en lecture seule :
__dict__
est l’objet dictionnaire répertoriant l’espace de nommage du module.CPython implementation detail: en raison de la manière dont CPython nettoie les dictionnaires de modules, le dictionnaire du module est effacé quand le module n’est plus visible, même si le dictionnaire possède encore des références actives. Pour éviter ceci, copiez le dictionnaire ou gardez le module dans votre champ de visibilité tant que vous souhaitez utiliser le dictionnaire directement.
- Classes déclarées par le développeur
Le type d’une classe déclarée par le développeur est créé au moment de la définition de la classe (voir la section Définition de classes). Une classe possède un espace de nommage implémenté sous la forme d’un objet dictionnaire. Les références vers les attributs de la classe sont traduits en recherches dans ce dictionnaire, par exemple
C.x
est traduit enC.__dict__["x"]
(bien qu’il existe un certain nombre de fonctions automatiques qui permettent de trouver des attributs par d’autres moyens). Si le nom d’attribut n’est pas trouvé dans ce dictionnaire, la recherche continue dans les classes de base. Les classes de base sont trouvées en utilisant l’ordre de résolution des méthodes (method resolution order en anglais, ou MRO) C3 qui a un comportement cohérent même en présence d’héritages en « diamant », où différentes branches d’héritages conduisent vers un ancêtre commun. Vous trouverez plus de détails sur l’ordre de résolution des méthodes MRO C3 utilisé par Python dans la documentation de la version 2.3 disponible sur https://www.python.org/download/releases/2.3/mro/.Quand une référence à un attribut de classe (disons la classe
C
) pointe vers un objet méthode de classe, elle est transformée en objet méthode d’instance dont l’attribut__self__
estC
. Quand elle pointe vers un objet méthode statique, elle est transformée en objet encapsulé par l’objet méthode statique. Reportez-vous à la section Implémentation de descripteurs pour une autre manière dont les attributs d’une classe diffèrent de ceux réellement contenus dans son__dict__
.Les assignations d’un attribut de classe mettent à jour le dictionnaire de la classe, jamais le dictionnaire d’une classe de base.
Un objet classe peut être appelé (voir ci-dessus) pour produire une instance de classe (voir ci-dessous).
Attributs spéciaux :
__name__
est le nom de la classe ;__module__
est le nom du module dans lequel la classe est définie ;__dict__
est le dictionnaire contenant l’espace de nommage de la classe ;__bases__
est un tuple contenant les classes de base, dans l’ordre d’apparition dans la liste des classes de base ;__doc__
est la chaîne de documentation de la classe (ouNone
si elle n’existe pas) ;__annotations__
(optionnel) est un dictionnaire contenant les annotations de variables collectées durant l’exécution du corps de la classe.- Instances de classes
Une instance de classe est créée en appelant un objet classe (voir ci-dessus). Une instance de classe possède un espace de nommage implémenté sous la forme d’un dictionnaire qui est le premier endroit où sont recherchées les références aux attributs. Quand un attribut n’est pas trouvé dans ce dictionnaire et que la classe de l’instance contient un attribut avec ce nom, la recherche continue avec les attributs de la classe. Si un attribut de classe est trouvé et que c’est un objet fonction définie par l’utilisateur, il est transformé en objet méthode d’instance dont l’attribut
__self__
est l’instance. Les objets méthodes statiques et méthodes de classe sont aussi transformés ; reportez-vous ci-dessous à « Classes ». Lisez la section Implémentation de descripteurs pour une autre façon de récupérer les attributs d’une classe, où la récupération via ses instances peut différer des objets réellement stockés dans le__dict__
de la classe. Si aucun attribut de classe n’est trouvé et que la classe de l’objet possède une méthode__getattr__()
, cette méthode est appelée pour rechercher une correspondance.Les assignations et suppressions d’attributs mettent à jour le dictionnaire de l’instance, jamais le dictionnaire de la classe. Si la classe possède une méthode
__setattr__()
ou__delattr__()
, elle est appelée au lieu de mettre à jour le dictionnaire de l’instance directement.Les instances de classes peuvent prétendre être des nombres, des séquences ou des tableaux de correspondance si elles ont des méthodes avec des noms spéciaux. Voir la section Méthodes spéciales.
Attributs spéciaux :
__dict__
est le dictionnaire des attributs ;__class__
est la classe de l’instance.- Objets Entrées-Sorties (ou objets fichiers)
Un objet fichier représente un fichier ouvert. Différents raccourcis existent pour créer des objets fichiers : la fonction native
open()
et aussios.popen()
,os.fdopen()
ou la méthodemakefile()
des objets connecteurs (et sûrement d’autres fonctions ou méthodes fournies par les modules d’extensions).Les objets
sys.stdin
,sys.stdout
etsys.stderr
sont initialisés à des objets fichiers correspondant à l’entrée standard, la sortie standard et le flux d’erreurs de l’interpréteur ; ils sont tous ouverts en mode texte et se conforment donc à l’interface définie par la classe abstraiteio.TextIOBase
.- Types internes
Quelques types utilisés en interne par l’interpréteur sont accessibles à l’utilisateur. Leur définition peut changer dans les futures versions de l’interpréteur mais ils sont donnés ci-dessous à fin d’exhaustivité.
- Objets Code
Un objet code représente le code Python sous sa forme compilée en bytecode. La différence entre un objet code et un objet fonction est que l’objet fonction contient une référence explicite vers les globales de la fonction (le module dans lequel elle est définie) alors qu’un objet code ne contient aucun contexte ; par ailleurs, les valeurs par défaut des arguments sont stockées dans l’objet fonction, pas dans l’objet code (parce que ce sont des valeurs calculées au moment de l’exécution). Contrairement aux objets fonctions, les objets codes sont immuables et ne contiennent aucune référence (directe ou indirecte) à des objets muables.
Attributs spéciaux en lecture seule :
co_name
donne le nom de la fonction ;co_argcount
est le nombre d’arguments positionnels (y compris les arguments avec des valeurs par défaut) ;co_nlocals
est le nombre de variables locales utilisées par la fonction (y compris les arguments) ;co_varnames
est un tuple contenant le nom des variables locales (en commençant par les noms des arguments) ;co_cellvars
est un tuple contenant les noms des variables locales qui sont référencées par des fonctions imbriquées ;co_freevars
est un tuple contenant les noms des variables libres ;co_code
est une chaîne représentant la séquence des instructions de bytecode ;co_consts
est un tuple contenant les littéraux utilisés par le bytecode ;co_names
est un tuple contenant les noms utilisés par le bytecode ;co_filename
est le nom de fichier à partir duquel le code a été compilé ;co_firstlineno
est numéro de la première ligne de la fonction ;co_lnotab
est une chaîne qui code la correspondance entre les différents endroits du bytecode et les numéros de lignes (pour les détails, regardez le code source de l’interpréteur) ;co_stacksize
est la taille de pile nécessaire (y compris pour les variables locales) ;co_flags
est un entier qui code différents drapeaux pour l’interpréteur.Les drapeaux suivants sont codés par des bits dans
co_flags
: le bit0x04
est positionné à 1 si la fonction utilise la syntaxe*arguments
pour accepter un nombre arbitraire d’arguments positionnels ; le bit0x08
est positionné à 1 si la fonction utilise la syntaxe**keywords
pour accepter un nombre arbitraire d’arguments nommés ; le bit0x20
est positionné à 1 si la fonction est un générateur.Les déclarations de fonctionnalité future
from __future__ import division
utilisent aussi des bits dansco_flags
pour indiquer si l’objet code a été compilé avec une fonctionnalité future : le bit0x2000
est positionné à 1 si la fonction a été compilée avec la division future activée ; les bits0x10
et0x1000
étaient utilisés dans les versions antérieures de Python.Les autres bits de
co_flags
sont réservés à un usage interne.Si l’objet code représente une fonction, le premier élément dans
co_consts
est la chaîne de documentation de la fonction (ouNone
s’il n’y en a pas).
- Objets cadres
Un objet cadre représente le cadre d’exécution. Ils apparaissent dans des objets traces (voir plus loin).
Attributs spéciaux en lecture seule :
f_back
pointe vers le cadre précédent (l’appelant) ouNone
si c’est le pied de la pile d’appel ;f_code
est l’objet code en cours d’exécution dans ce cadre ;f_locals
est le dictionnaire dans lequel sont cherchées les variables locales ;f_globals
est utilisé pour les variables globales ;f_builtins
est utilisé pour les noms natifs ;f_lasti
donne l’instruction précise (c’est un indice dans la chaîne de bytecode de l’objet code).Attributs spéciaux en lecture-écriture :
f_trace
, s’il ne vaut pasNone
, est une fonction appelée au début de chaque ligne de code source (c’est utilisé par le débogueur) ;f_lineno
est le numéro de la ligne courante du cadre — écrire dedans depuis une fonction trace fait sauter à la ligne demandée (seulement pour le cadre le plus bas). Un débogueur peut implémenter une commande « sauter vers » en écrivant dans f_lineno.Les objets cadres comprennent une méthode :
-
frame.
clear
()¶ Cette méthode efface toutes les références aux variables locales conservées dans le cadre. Par ailleurs, si le cadre est celui d’un générateur, le générateur se termine. Ceci permet de casser des références cycliques qui incluent des objets cadres (par exemple, lors de la capture d’une exception et du stockage de la pile d’appels pour une utilisation future).
RuntimeError
est levée si le cadre est en cours d’exécution.Nouveau dans la version 3.4.
-
- Objets traces
Un objet trace représente la pile d’appels d’une exception. Il est créé au moment où l’exception est levée. Quand l’interpréteur recherche un gestionnaire d’exception en remontant la pile d’exécution, un objet trace est inséré devant l’objet trace courant à chaque nouveau niveau. Quand il entre dans le gestionnaire d’exception, la pile d’appels est rendue accessible au programme (voir la section L’instruction try). Elle est accessible par le troisième élément du tuple renvoyé par
sys.exc_info()
. Quand le programme ne dispose pas d’un gestionnaire adéquat, la pile d’appels est écrite (joliment formatée) sur le flux d’erreurs standard ; si l’interpréteur est interactif, la pile d’appels est rendue accessible à l’utilisateur en tant quesys.last_traceback
.Attributs spéciaux en lecture seule :
tb_next
est le prochain niveau dans la pile d’appels (vers le cadre où l’exception a été levée) ouNone
s’il n’y a pas de prochain niveau ;tb_frame
pointe vers le cadre d’exécution du niveau courant ;tb_lineno
donne le numéro de ligne où l’exception a été levée ;tb_lasti
indique l’instruction précise. Le numéro de ligne et la dernière instruction dans la trace peuvent différer du numéro de ligne de l’objet cadre si l’exception a eu lieu dans une instructiontry
sans qu’il n’y ait de clauseexcept
adéquate ou sans clausefinally
.- Objets tranches
Un objet tranche est utilisé pour représenter des découpes des méthodes
__getitem__()
. Ils sont aussi créés par la fonction nativeslice()
.Attributs spéciaux en lecture seule :
start
est la borne inférieure ;stop
est la borne supérieure ;step
est la valeur du pas ; chaque attribut vautNone
s’il est omis. Ces attributs peuvent être de n’importe quel type.Les objets tranches comprennent une méthode :
-
slice.
indices
(self, length)¶ Cette méthode prend un argument entier length et calcule les informations de la tranche que l’objet découpe décrit s’il est appliqué à une séquence de length éléments. Elle renvoie un tuple de trois entiers ; respectivement, ce sont les indices de début et fin ainsi que le pas de découpe. Les indices manquants ou en dehors sont gérés de manière cohérente avec les tranches normales.
-
- Objets méthodes statiques
Les objets méthodes statiques permettent la transformation des objets fonctions en objets méthodes décrits au-dessus. Un objet méthode statique encapsule tout autre objet, souvent un objet méthode définie par l’utilisateur. Quand un objet méthode statique est récupéré depuis une classe ou une instance de classe, l’objet réellement renvoyé est un objet encapsulé, qui n’a pas vocation à être transformé encore une fois. Les objets méthodes statiques ne sont pas appelables en tant que tels, bien que les objets qu’ils encapsulent le soient souvent. Les objets méthodes statiques sont créés par le constructeur natif
staticmethod()
.- Objets méthodes de classes
Un objet méthode de classe, comme un objet méthode statique, encapsule un autre objet afin de modifier la façon dont cet objet est récupéré depuis les classes et instances de classes. Le comportement des objets méthodes de classes dans le cas d’une telle récupération est décrit plus haut, dans « méthodes définies par l’utilisateur ». Les objets méthodes de classes sont créés par le constructeur natif
classmethod()
.
3.3. Méthodes spéciales¶
Une classe peut implémenter certaines opérations que l’on invoque par une syntaxe spéciale (telles que les opérations arithmétiques ou la découpe en tranches) en définissant des méthodes aux noms particuliers. C’est l’approche utilisée par Python pour la surcharge d’opérateur, permettant à une classe de définir son propre comportement vis-à-vis des opérateurs du langage. Par exemple, si une classe définit une méthode __getitem__()
et que x
est une instance de cette classe, alors x[i]
est globalement équivalent à type(x).__getitem__(x, i)
. Sauf lorsque c’est mentionné, toute tentative d’appliquer une opération alors que la méthode appropriée n’est pas définie lève une exception (typiquement AttributeError
ou TypeError
).
Définir une méthode spéciale à None
indique que l’opération correspondante n’est pas disponible. Par exemple, si une classe assigne None
à __iter__()
, vous ne pouvez pas itérer sur la classe et appeler iter()
sur une instance lève TypeError
(sans se replier sur __getitem__()
) 2.
Lorsque vous implémentez une classe qui émule un type natif, il est important que cette émulation n’implémente que ce qui fait sens pour l’objet qui est modélisé. Par exemple, la recherche d’éléments individuels d’une séquence peut faire sens, mais pas l’extraction d’une tranche (un exemple est l’interface de NodeList
dans le modèle objet des documents W3C).
3.3.1. Personnalisation de base¶
-
object.
__new__
(cls[, ...])¶ Appelée pour créer une nouvelle instance de la classe cls. La méthode
__new__()
est statique (c’est un cas particulier, vous n’avez pas besoin de la déclarer comme telle) qui prend comme premier argument la classe pour laquelle on veut créer une instance. Les autres arguments sont ceux passés à l’expression de l’objet constructeur (l’appel à la classe). La valeur de retour de__new__()
doit être l’instance du nouvel objet (classiquement une instance de cls).Une implémentation typique crée une nouvelle instance de la classe en invoquant la méthode
__new__()
de la superclasse à l’aide desuper().__new__(cls[, ...])
avec les arguments adéquats, puis modifie l’instance nouvellement créée en tant que de besoin avant de la renvoyer.Si
__new__()
renvoie une instance de cls, alors la méthode__init__()
de la nouvelle instance est invoquée avec__init__(self[, ...])
où self est la nouvelle instance et les autres arguments sont les mêmes que ceux passés à__new__()
.Si
__new__()
ne renvoie pas une instance de cls, alors la méthode__init__()
de la nouvelle instance n’est pas invoquée.L’objectif de
__new__()
est principalement, pour les sous-classes de types immuables (commeint
,str
outuple
), d’autoriser la création sur mesure des instances. Elle est aussi souvent surchargée dans les méta-classes pour particulariser la création des classes.
-
object.
__init__
(self[, ...])¶ Appelée après la création de l’instance (par
__new__()
), mais avant le retour vers l’appelant. Les arguments sont ceux passés à l’expression du constructeur de classe. Si une classe de base possède une méthode__init__()
, la méthode__init__()
de la classe dérivée, si elle existe, doit explicitement appeler cette méthode pour assurer une initialisation correcte de la partie classe de base de l’instance ; par exemple :super().__init__([args...])
.Comme
__new__()
et__init__()
travaillent ensemble pour créer des objets (__new__()
pour le créer,__init__()
pour le particulariser),__init__()
ne doit pas renvoyer de valeurNone
; sinon une exceptionTypeError
est levée à l’exécution.
-
object.
__del__
(self)¶ Appelée au moment où une instance est sur le point d’être détruite. On l’appelle aussi finaliseur ou (improprement) destructeur. Si une classe de base possède une méthode
__del__()
, la méthode__del__()
de la classe dérivée, si elle existe, doit explicitement l’appeler pour s’assurer de l’effacement correct de la partie classe de base de l’instance.Il est possible (mais pas recommandé) que la méthode
__del__()
retarde la destruction de l’instance en créant une nouvelle référence vers cet objet. Python appelle ceci la résurrection d’objet. En fonction de l’implémentation,__del__()
peut être appelée une deuxième fois au moment où l’objet ressuscité va être détruit ; l’implémentation actuelle de CPython ne l’appelle qu’une fois.Il n’est pas garanti que soient appelées les méthodes
__del__()
des objets qui existent toujours quand l’interpréteur termine.Note
del x
n’appelle pas directementx.__del__()
— la première décrémente le compteur de références dex
. La seconde n’est appelée que quand le compteur de références dex
atteint zéro.CPython implementation detail: It is possible for a reference cycle to prevent the reference count of an object from going to zero. In this case, the cycle will be later detected and deleted by the cyclic garbage collector. A common cause of reference cycles is when an exception has been caught in a local variable. The frame’s locals then reference the exception, which references its own traceback, which references the locals of all frames caught in the traceback.
Voir aussi
Documentation du module
gc
.Avertissement
En raison des conditions particulières qui règnent quand
__del__()
est appelée, les exceptions levées pendant son exécution sont ignorées et, à la place, un avertissement est affiché sursys.stderr
. En particulier :__del__()
peut être invoquée quand du code arbitraire est en cours d’exécution, et ce dans n’importe quel fil d’exécution. Si__del__()
a besoin de poser un verrou ou d’accéder à tout autre ressource bloquante, elle peut provoquer un blocage mutuel (deadlock en anglais) car la ressource peut être déjà utilisée par le code qui est interrompu pour exécuter la méthode__del__()
.__del__()
peut être exécutée pendant que l’interpréteur se ferme. En conséquence, les variables globales auxquelles elle souhaite accéder (y compris les autres modules) peuvent déjà être détruites ou assignées àNone
. Python garantit que les variables globales dont le nom commence par un tiret bas sont supprimées de leur module avant que les autres variables globales ne le soient ; si aucune autre référence vers ces variables globales n’existe, cela peut aider à s’assurer que les modules importés soient toujours accessibles au moment où la méthode__del__()
est appelée.
-
object.
__repr__
(self)¶ Appelée par la fonction native
repr()
pour calculer la représentation « officielle » en chaîne de caractères d’un objet. Tout est fait pour que celle-ci ressemble à une expression Python valide pouvant être utilisée pour recréer un objet avec la même valeur (dans un environnement donné). Si ce n’est pas possible, une chaîne de la forme<...une description utile...>
est renvoyée. La valeur renvoyée doit être un objet chaîne de caractères. Si une classe définit__repr__()
mais pas__str__()
, alors__repr__()
est aussi utilisée quand une représentation « informelle » en chaîne de caractères est demandée pour une instance de cette classe.Cette fonction est principalement utilisée à fins de débogage, il est donc important que la représentation donne beaucoup d’informations et ne soit pas ambigüe.
-
object.
__str__
(self)¶ Appelée par
str(objet)
ainsi que les fonctions nativesformat()
etprint()
pour calculer une chaîne de caractères « informelle » ou joliment mise en forme de représentation de l’objet. La valeur renvoyée doit être un objet string.Cette méthode diffère de
object.__repr__()
car il n’est pas attendu que__str__()
renvoie une expression Python valide : une représentation plus agréable à lire ou plus concise peut être utilisée.C’est l’implémentation par défaut des appels à
object.__repr__()
du type natifobject
.
-
object.
__bytes__
(self)¶ Appelée par bytes pour calculer une représentation en chaîne bytes d’un objet. Elle doit renvoyer un objet
bytes
.
-
object.
__format__
(self, format_spec)¶ Appelée par la fonction native
format()
et, par extension, lors de l’évaluation de formatted string literals ou de la méthodestr.format()
. Elle produit une chaîne de caractères « formatée » représentant un objet. L’argumentformat_spec
est une chaîne de caractères contenant la description des options de formatage voulues. L’interprétation de l’argumentformat_spec
est laissée au type implémentant__format__()
. Cependant, la plupart des classes délèguent le formatage aux types natifs ou utilisent une syntaxe similaire d’options de formatage.Lisez Mini-langage de spécification de format pour une description de la syntaxe standard du formatage.
La valeur renvoyée doit être un objet chaîne de caractères.
Modifié dans la version 3.4: La méthode
__format__
deobject
lui-même lève uneTypeError
si vous lui passez une chaîne non vide.
-
object.
__lt__
(self, other)¶ -
object.
__le__
(self, other)¶ -
object.
__eq__
(self, other)¶ -
object.
__ne__
(self, other)¶ -
object.
__gt__
(self, other)¶ -
object.
__ge__
(self, other)¶ Ce sont les méthodes dites de « comparaisons riches ». La correspondance entre les symboles opérateurs et les noms de méthodes est la suivante :
x<y
appellex.__lt__(y)
,x<=y
appellex.__le__(y)
,x==y
appellex.__eq__(y)
,x!=y
appellex.__ne__(y)
,x>y
appellex.__gt__(y)
etx>=y
appellex.__ge__(y)
.Une méthode de comparaison riche peut renvoyer le singleton
NotImplemented
si elle n’implémente pas l’opération pour une paire donnée d’arguments. Par convention,False
etTrue
sont renvoyées pour une comparaison qui a réussi. Cependant, ces méthodes peuvent renvoyer n’importe quelle valeur donc, si l’opérateur de comparaison est utilisé dans un contexte booléen (par exemple dans une condition d’une instructionif
), Python appellebool()
sur la valeur pour déterminer si le résultat est faux ou vrai.Par défaut,
__ne__()
délègue à__eq__()
et renvoie le résultat inverse, sauf si c’estNotImplemented
. Il n’y a pas d’autres relations implicites pour les opérateurs de comparaison. Par exemple,(x<y or x==y)
n’implique pasx<=y
. Pour obtenir une relation d’ordre total automatique à partir d’une seule opération, reportez-vous àfunctools.total_ordering()
.Lisez le paragraphe
__hash__()
pour connaitre certaines notions importantes relatives à la création d’objets hashable qui acceptent les opérations de comparaison personnalisées et qui sont utilisables en tant que clés de dictionnaires.Il n’y a pas de versions avec les arguments interchangés de ces méthodes (qui seraient utilisées quand l’argument de gauche ne connaît pas l’opération alors que l’argument de droite la connaît) ; en lieu et place,
__lt__()
et__gt__()
sont la réflexion l’une de l’autre,__le__()
et__ge__()
sont la réflexion l’une de l’autre et__eq__()
ainsi que__ne__()
sont réflexives. Si les opérandes sont de types différents et que l’opérande de droite est d’un type qui une sous-classe directe ou indirecte du type de l’opérande de gauche, alors la méthode symétrique de l’opérande de droite est prioritaire, sinon c’est la méthode de l’opérande de gauche qui est prioritaire. Les sous-classes virtuelles ne sont pas prises en compte.
-
object.
__hash__
(self)¶ Appelée par la fonction native
hash()
et par les opérations sur les membres de collections hachées (ce qui comprendset
,frozenset
etdict
).__hash__()
doit renvoyer un entier. La seule propriété requise est que les objets qui sont égaux pour la comparaison doivent avoir la même valeur de hachage ; il est conseillé de mélanger les valeurs de hachage des composants d’un objet qui jouent un rôle de la comparaison des objets, en les plaçant un tuple dont on calcule l’empreinte. Par exemple :def __hash__(self): return hash((self.name, self.nick, self.color))
Note
hash()
limite la valeur renvoyée d’un objet ayant une méthode__hash__()
personnalisée à la taille d’unPy_ssize_t
. C’est classiquement 8 octets pour une implémentation 64 bits et 4 octets sur une implémentation 32 bits. Si la méthode__hash__()
d’un objet doit être interopérable sur des plateformes ayant des implémentations différentes, assurez-vous de vérifier la taille du hachage sur toutes les plateformes. Une manière facile de le faire est la suivante :python -c "import sys; print(sys.hash_info.width)"
.Si une classe ne définit pas de méthode
__eq__()
, elle ne doit pas définir l’opération__hash__()
non plus ; si elle définit__eq__()
mais pas__hash__()
, les instances ne peuvent pas être utilisées en tant qu’élément dans une collection de hachables. Si une classe définit des objets mutables et implémente la méthode__eq__()
, elle ne doit pas implémenter__hash__()
puisque l’implémentation des collections hachables requiert que les clés soient des empreintes immuables (si l’empreinte d’un objet change, il ne sera plus trouvé correctement dans le stockage du dictionnaire).Les classes définies par l’utilisateur possèdent des méthodes
__eq__()
et__hash__()
par défaut ; ces méthodes répondent que tous les objets sont différents (sauf avec eux-mêmes) etx.__hash__()
renvoie une valeur telle quex == y
implique à la foisx is y
ethash(x) == hash(y)
.Une classe qui surcharge
__eq__()
et qui ne définit pas__hash__()
a sa méthode__hash__()
implicitement assignée àNone
. Quand la méthode__hash__()
d’une classe estNone
, une instance de cette classe lèveTypeError
quand un programme essaie de demander son empreinte et elle est correctement identifiée comme non hachable quand on vérifieisinstance(obj, collections.Hashable)
.Si une classe qui surcharge
__eq__()
a besoin de conserver l’implémentation de__hash__()
de la classe parente, vous devez l’indiquer explicitement à l’interpréteur en définissant__hash__ = <ClasseParente>.__hash__
.Si une classe ne surcharge pas
__eq__()
et veut supprimer le calcul des empreintes, elle doit inclure__hash__ = None
dans la définition de la classe. Une classe qui définit sa propre méthode__hash__()
qui lève explicitementTypeError
serait incorrectement identifiée comme hachable par un appel àisinstance(obj, collections.Hashable)
.Note
Par défaut, les valeurs renvoyées par
__hash__()
pour les chaînes, bytes et objets datetime sont salées avec une valeur aléatoire non prévisible. Bien qu’une empreinte reste constante tout au long d’un processus Python, sa valeur n’est pas prévisible entre deux invocations de Python.C’est un comportement voulu pour se protéger contre un déni de service qui utiliserait des entrées malicieusement choisies pour effectuer des insertions dans le dictionnaire dans le pire cas, avec une complexité en O(n^2). Lisez http://www.ocert.org/advisories/ocert-2011-003.html pour en obtenir les détails (article en anglais).
Modifier les empreintes obtenues par hachage modifie l’ordre d’itération sur les dictionnaires, les ensembles et les autres tableaux de correspondances. Python n’a jamais donné de garantie sur cet ordre (d’ailleurs, l’ordre n’est pas le même entre les implémentations 32 et 64 bits).
Voir aussi
PYTHONHASHSEED
.Modifié dans la version 3.3: la randomisation des empreintes est activée par défaut.
-
object.
__bool__
(self)¶ Appelée pour implémenter les tests booléens et l’opération native
bool()
; elle doit renvoyerFalse
ouTrue
. Quand cette méthode n’est pas définie,__len__()
est appelée, si elle est définie, et l’objet est considéré vrai si le résultat est non nul. Si une classe ne définit ni__len__()
ni__bool__()
, toutes ses instances sont considérées comme vraies.
3.3.2. Personnalisation de l’accès aux attributs¶
Les méthodes suivantes peuvent être définies pour personnaliser l’accès aux attributs (utilisation, assignation, suppression de x.name
) pour les instances de classes.
-
object.
__getattr__
(self, name)¶ Appelée lorsque l’accès par défaut à l’attribut échoue en levant
AttributeError
(soit__getattribute__()
lèveAttributeError
car name n’est pas un attribut de l’instance ou un attribut dans l’arborescence de la classe deself
; ou__get__()
de la propriété name lèveAttributeError
). Cette méthode doit retourner soit la valeur (calculée) de l’attribut, soit lever une exceptionAttributeError
.Notez que si l’attribut est trouvé par le mécanisme normal,
__getattr__()
n’est pas appelée (c’est une asymétrie voulue entre__getattr__()
et__setattr__()
). Ce comportement est adopté à la fois pour des raisons de performance et parce que, sinon,__getattr__()
n’aurait aucun moyen d’accéder aux autres attributs de l’instance. Notez que, au moins pour ce qui concerne les variables d’instance, vous pouvez simuler un contrôle total en n’insérant aucune valeur dans le dictionnaire des attributs de l’instance (mais en les insérant dans un autre objet à la place). Lisez la partie relative à la méthode__getattribute__()
ci-dessous pour obtenir un contrôle total effectif sur l’accès aux attributs.
-
object.
__getattribute__
(self, name)¶ Appelée de manière inconditionnelle pour implémenter l’accès aux attributs des instances de la classe. Si la classe définit également
__getattr__()
, cette dernière n’est pas appelée à moins que__getattribute__()
ne l’appelle explicitement ou ne lève une exceptionAttributeError
. Cette méthode doit renvoyer la valeur (calculée) de l’attribut ou lever une exceptionAttributeError
. Afin d’éviter une récursion infinie sur cette méthode, son implémentation doit toujours appeler la méthode de la classe de base avec le même paramètre name pour accéder à n’importe quel attribut dont elle a besoin. Par exemple,object.__getattribute__(self, name)
.Note
Cette méthode peut être shuntée lorsque la recherche porte sur les méthodes spéciales en tant que résultat d’une invocation implicite via la syntaxe du langage ou les fonctions natives. Lisez Recherche des méthodes spéciales.
-
object.
__setattr__
(self, name, value)¶ Appelée lors d’une assignation d’attribut. Elle est appelée à la place du mécanisme normal (c’est-à-dire stocker la valeur dans le dictionnaire de l’instance). name est le nom de l’attribut, value est la valeur à assigner à cet attribut.
Si
__setattr__()
veut assigner un attribut d’instance, elle doit appeler la méthode de la classe de base avec le même nom, par exempleobject.__setattr__(self, name, value)
.
-
object.
__delattr__
(self, name)¶ Comme
__setattr__()
mais pour supprimer un attribut au lieu de l’assigner. Elle ne doit être implémentée que sidel obj.name
a du sens pour cet objet.
-
object.
__dir__
(self)¶ Appelée quand
dir()
est appelée sur l’objet. Elle doit renvoyer une séquence.dir()
convertit la séquence renvoyée en liste et effectue le classement.
3.3.2.1. Personnalisation de l’accès aux attributs d’un module¶
Pour une personnalisation plus fine du comportement d’un module (assignation des attributs, propriétés, etc.), vous pouvez assigner l’attribut __class__
d’un objet module à une sous-classe de types.ModuleType
. Par exemple :
import sys
from types import ModuleType
class VerboseModule(ModuleType):
def __repr__(self):
return f'Verbose {self.__name__}'
def __setattr__(self, attr, value):
print(f'Setting {attr}...')
setattr(self, attr, value)
sys.modules[__name__].__class__ = VerboseModule
Note
Définir __class__
pour le module affecte uniquement les recherches qui utilisent la syntaxe d’accès aux attributs – accéder directement aux globales d’un module (soit par le code dans le module, soit via une référence au dictionnaire des variables globales du module) fonctionne toujours de la même façon.
Modifié dans la version 3.5: l’attribut __class__
du module est maintenant en lecture-écriture.
3.3.2.2. Implémentation de descripteurs¶
Les méthodes qui suivent s’appliquent seulement quand une instance de la classe (dite classe descripteur) contenant la méthode apparaît dans une classe propriétaire (owner en anglais) ; la classe descripteur doit figurer dans le dictionnaire de la classe propriétaire ou dans le dictionnaire de la classe d’un des parents. Dans les exemples ci-dessous, « l’attribut » fait référence à l’attribut dont le nom est une clé du __dict__
de la classe propriétaire.
-
object.
__get__
(self, instance, owner)¶ Appelée pour obtenir l’attribut de la classe propriétaire (accès à un attribut de classe) ou d’une instance de cette classe (accès à un attribut d’instance). owner est toujours la classe propriétaire alors que instance est l’instance par laquelle on accède à l’attribut ou
None
lorsque l’on accède par la classe owner. Cette méthode doit renvoyer la valeur (calculée) de l’attribut ou lever une exceptionAttributeError
.
-
object.
__set__
(self, instance, value)¶ Appelée pour définir l’attribut d’une instance instance de la classe propriétaire à la nouvelle valeur value.
-
object.
__delete__
(self, instance)¶ Appelée pour supprimer l’attribut de l’instance instance de la classe propriétaire.
-
object.
__set_name__
(self, owner, name)¶ Appelée au moment où la classe propriétaire owner est créée. La classe descripteur a été assignée à name.
Nouveau dans la version 3.6.
L’attribut __objclass__
est interprété par le module inspect
comme spécifiant la classe où cet objet a été défini (le définir correctement peut vous aider dans l’introspection des classes dynamiques à l’exécution). Pour les appelables, cela peut indiquer qu’une instance d’un certain type (ou d’une certaine sous-classe) est attendue ou requise comme premier argument positionnel (par exemple, CPython définit cet attribut pour les méthodes non liées qui sont implémentées en C).
3.3.2.3. Invocation des descripteurs¶
En général, un descripteur est un attribut d’objet dont le comportement est « lié » (binding dehavior en anglais), c’est-à-dire que les accès aux attributs ont été surchargés par des méthodes conformes au protocole des descripteurs : __get__()
, __set__()
et __delete__()
. Si l’une de ces méthodes est définie pour un objet, il est réputé être un descripteur.
Le comportement par défaut pour la gestion d’un attribut est de définir, obtenir et supprimer cet attribut du dictionnaire de l’objet. Par exemple, pour a.x
Python commence d’abord par rechercher a.__dict__['x']
, puis type(a).__dict__['x']
; ensuite Python continue en remontant les classes de base de type(a)
, en excluant les méta-classes.
Cependant, si la valeur cherchée est un objet qui définit une des méthodes de descripteur, alors Python modifie son comportement et invoque la méthode du descripteur à la place. Le moment où cela intervient dans la recherche citée ci-dessus dépend de l’endroit où a été définie la méthode de descripteur et comment elle a été appelée.
Le point de départ pour une invocation de descripteur est la liaison a.x
. La façon dont les arguments sont assemblés dépend de a
:
- Appel direct
Le plus simple et le plus rare des appels est quand l’utilisateur code directement l’appel à la méthode du descripteur :
x.__get__(a)
.- Liaison avec une instance
Si elle est liée à un objet instance,
a.x
est transformé en l’appel suivant :type(a).__dict__['x'].__get__(a, type(a))
.- Liaison avec une classe
Si elle est liée à une classe,
A.x
est transformé en l’appel suivant :A.__dict__['x'].__get__(None, A)
.- Liaison super
Si
a
est une instance desuper
, alorssuper(B, obj).m()
rechercheobj.__class__.__mro__
pour la classe de baseA
immédiatement avantB
puis invoque le descripteur avec l’appel suivant :A.__dict__['m'].__get__(obj, obj.__class__)
.
Pour des liaisons avec des instances, la priorité à l’invocation du descripteur dépend des méthodes que le descripteur a définies. Un descripteur peut définir n’importe quelle combinaison de __get__()
, __set__()
et __delete__()
. S’il ne définit pas __get__()
, alors accéder à l’attribut retourne l’objet descripteur lui-même sauf s’il existe une valeur dans le dictionnaire de l’objet instance. Si le descripteur définit __set__()
ou __delete__()
, c’est un descripteur de données ; s’il ne définit aucune méthode, c’est un descripteur hors-donnée. Normalement, les descripteurs de données définissent à la fois __get__()
et __set__()
, alors que les descripteurs hors-données définissent seulement la méthode __get__()
. Les descripteurs de données qui définissent __set__()
et __get__()
sont toujours prioritaires face à une redéfinition du dictionnaire de l’instance. En revanche, les descripteurs hors-données peuvent être shuntés par les instances.
Les méthodes Python (y compris staticmethod()
et classmethod()
) sont implémentées comme des descripteurs hors-donnée. De la même manière, les instances peuvent redéfinir et surcharger les méthodes. Ceci permet à chaque instance d’avoir un comportement qui diffère des autres instances de la même classe.
La fonction property()
est implémentée en tant que descripteur de données. Ainsi, les instances ne peuvent pas surcharger le comportement d’une propriété.
3.3.2.4. __slots__
¶
Les __slots__
vous permettent de déclarer des membres d’une donnée (comme une propriété) et d’interdire la création de __dict__ ou de __weakref__ (à moins qu’ils ne soient explicitement déclarés dans le __slots__
ou présent dans le parent).
L’espace gagné par rapport à l’utilisation d’un __dict__ peut être significatif.
-
object.
__slots__
¶ Cette variable de classe peut être assignée avec une chaîne, un itérable ou une séquence de chaînes avec les noms de variables utilisés par les instances. __slots__ réserve de la place pour ces variables déclarées et interdit la création automatique de __dict__ et __weakref__ pour chaque instance.
3.3.2.4.1. Note sur l’utilisation de __slots__¶
Lorsque vous héritez d’une classe sans __slots__, les attributs __dict__ et __weakref__ des instances sont toujours accessibles.
Sans variable __dict__, les instances ne peuvent pas assigner de nouvelles variables (non listées dans la définition de __slots__). Les tentatives d’assignation sur un nom de variable non listé lève
AttributeError
. Si l’assignation dynamique de nouvelles variables est nécessaire, ajoutez'__dict__'
à la séquence de chaînes dans la déclaration __slots__.Sans variable __weakref__ pour chaque instance, les classes qui définissent __slots__ ne gèrent pas les références faibles vers leurs instances. Si vous avez besoin de gérer des références faibles, ajoutez
'__weakref__'
à la séquence de chaînes dans la déclaration de __slots__.Les __slots__ sont implémentés au niveau de la classe en créant des descripteurs (Implémentation de descripteurs) pour chaque nom de variable. Ainsi, les attributs de classe ne peuvent pas être utilisés pour des valeurs par défaut aux variables d’instances définies par __slots__ ; sinon, l’attribut de classe surchargerait l’assignation par descripteur.
L’action de la déclaration du __slots__ ne se limite pas à la classe où il est défini. Les __slots__ déclarés par les parents sont disponibles dans les classes enfants. Cependant, les sous-classes enfants ont un __dict__ et un __weakref__ à moins qu’elles ne définissent aussi un __slots__ (qui ne doit contenir alors que les noms supplémentaires du slot).
Si une classe définit un slot déjà défini dans une classe de base, la variable d’instance définie par la classe de base est inaccessible (sauf à utiliser le descripteur de la classe de base directement). Cela rend la signification du programme indéfinie. Dans le futur, une vérification sera ajoutée pour empêcher cela.
Un __slot__ non vide ne fonctionne pas pour les classes dérivées des types natifs à longueur variable tels que
int
,bytes
ettuple
.Tout itérable qui n’est pas une chaîne peut être assigné à un __slots__. Les tableaux de correspondance peuvent aussi être utilisés ; cependant, dans le futur, des significations spéciales pourraient être associées à chacune des clés.
Les assignations de __class__ ne fonctionnent que si les deux classes ont le même __slots__.
L’héritage multiple avec plusieurs classes parentes qui ont des __slots__ est possible, mais seul un parent peut avoir des attributs créés par __slots__ (les autres classes parentes doivent avoir des __slots__ vides). La violation de cette règle lève
TypeError
.
3.3.3. Personnalisation de la création de classes¶
Quand une classe hérite d’une classe parente, __init_subclass__ de la classe parente est appelée. Ainsi, il est possible d’écrire des classes qui modifient le comportement des sous-classes. Ce comportement est corrélé aux décorateurs de classes mais, alors que les décorateurs de classes agissent seulement sur la classe qu’ils décorent, __init_subclass__
agit uniquement sur les futures sous-classes de la classe qui définit cette méthode.
-
classmethod
object.
__init_subclass__
(cls)¶ Cette méthode est appelée quand la classe est sous-classée. cls est alors la nouvelle sous-classe. Si elle est définie en tant que méthode d’instance normale, cette méthode est implicitement convertie en méthode de classe.
Les arguments nommés qui sont donnés à la nouvelle classe sont passés à
__init_subclass__
de la classe parente. Par souci de compatibilité avec les autres classes qui utilisent__init_subclass__
, vous devez enlever les arguments nommés dont vous avez besoin et passer les autres à la classe de base, comme ci-dessous :class Philosopher: def __init_subclass__(cls, default_name, **kwargs): super().__init_subclass__(**kwargs) cls.default_name = default_name class AustralianPhilosopher(Philosopher, default_name="Bruce"): pass
L’implémentation par défaut
object.__init_subclass__
ne fait rien mais lève une erreur si elle est appelée avec un argument.Note
L’indication de méta-classe
metaclass
est absorbée par le reste du mécanisme de types et n’est jamais passée à l’implémentation de__init_subclass__
. La méta-classe réelle (plutôt que l’indication explicite) peut être récupérée partype(cls)
.Nouveau dans la version 3.6.
3.3.3.1. Méta-classes¶
Par défaut, les classes sont construites en utilisant type()
. Le corps de la classe est exécuté dans un nouvel espace de nommage et le nom de la classe est lié localement au résultat de type(name, bases, namespace)`.
Le déroulement de création de la classe peut être personnalisé en passant l’argument nommé metaclass
dans la ligne de définition de la classe ou en héritant d’une classe existante qui comporte déjà un tel argument. Dans l’exemple qui suit, MyClass
et MySubclass
sont des instances de Meta
:
class Meta(type):
pass
class MyClass(metaclass=Meta):
pass
class MySubclass(MyClass):
pass
Tout autre argument nommé spécifié dans la définition de la classe est passé aux opérations de méta-classes décrites auparavant.
Quand la définition d’une classe est exécutée, les différentes étapes suivies sont :
la méta-classe appropriée est déterminée ;
l’espace de noms de la classe est préparé ;
le corps de la classe est exécuté ;
l’objet classe est crée.
3.3.3.2. Détermination de la méta-classe appropriée¶
La méta-classe appropriée pour une définition de classe est déterminée de la manière suivante :
si aucune classe et aucune méta-classe n’est donnée, alors
type()
est utilisée ;si une méta-classe explicite est donnée et que ce n’est pas une instance de
type()
, alors elle est utilisée directement en tant que méta-classe ;Si une instance de
type()
est donnée comme méta-classe explicite ou si bases est définie, alors la méta-classe la plus dérivée est utilisée.
La méta-classe la plus dérivée est choisie à partir des méta-classes explicitement spécifiées (s’il y en a) et les méta-classes (c’est-à-dire les type(cls)
) de toutes les classes de base spécifiées. La méta-classe la plus dérivée est celle qui est un sous-type de toutes ces méta-classes candidates. Si aucune des méta-classes candidates ne remplit ce critère, alors la définition de la classe échoue en levant TypeError
.
3.3.3.3. Préparation de l’espace de nommage de la classe¶
Une fois que la méta-classe appropriée est identifiée, l’espace de nommage de la classe est préparé. Si la méta-classe possède un attribut __prepare__
, il est appelé avec namespace = metaclass.__prepare__(name, bases, **kwds)
(où les arguments nommés supplémentaires, s’il y en a, viennent de la définition de la classe).
Si la méta-classe ne possède pas d’attribut __prepare__
, alors l’espace de nommage de la classe est initialisé en tant que tableau de correspondances ordonné.
Voir aussi
- PEP 3115 — Méta-classes dans Python 3000
introduction de la fonction automatique
__prepare__
de l’espace de nommage
3.3.3.4. Exécution du corps de la classe¶
Le corps de la classe est exécuté (approximativement) avec exec(body, globals(), namespace)
. La principale différence avec un appel normal à exec()
est que la portée lexicale autorise le corps de la classe (y compris les méthodes) à faire référence aux noms de la portée courante et des portées externes lorsque la définition de classe a lieu dans une fonction.
Cependant, même quand une définition de classe intervient dans une fonction, les méthodes définies à l’intérieur de la classe ne peuvent pas voir les noms définis en dehors de la portée de la classe. On accède aux variables de la classe via le premier paramètre des méthodes d’instance ou de classe, ou via la référence implicite __class__
incluse dans la portée lexicale et décrite dans la section suivante.
3.3.3.5. Création de l’objet classe¶
Quand l’espace de nommage a été rempli en exécutant le corps de la classe, l’objet classe est créé en appelant metaclass(name, bases, namespace, **kwds)
(les arguments nommés supplémentaires passés ici sont les mêmes que ceux passés à __prepare__
).
Cet objet classe est celui qui est référencé par la forme sans argument de super()
. __class__
est une référence implicite créée par le compilateur si une méthode du corps de la classe fait référence soit à __class__
, soit à super
. Ceci permet que la forme sans argument de super()
identifie la classe en cours de définition en fonction de la portée lexicale, tandis que la classe ou l’instance utilisée pour effectuer l’appel en cours est identifiée en fonction du premier argument transmis à la méthode.
CPython implementation detail: Dans CPython 3.6 et suivants, la cellule __class__
est passée à la méta-classe en tant qu’entrée __classcell__
dans l’espace de nommage de la classe. Si elle est présente, elle doit être propagée à l’appel type .__ new__
pour que la classe soit correctement initialisée. Ne pas le faire se traduit par un avertissement DeprecationWarning
dans Python 3.6 et un RuntimeError
dans Python 3.8.
Quand vous utilisez la méta-classe par défaut type
ou toute autre méta-classe qui finit par appeler type.__new__
, les étapes de personnalisation supplémentaires suivantes sont suivies après la création de l’objet classe :
d’abord,
type.__new__
récupère, dans l’espace de nommage de la classe, tous les descripteurs qui définissent une méthode__set_name__()
;ensuite, toutes ces méthodes
__set_name__
sont appelées avec la classe en cours de définition et le nom assigné à chaque descripteur ;finalement, la méthode automatique
__init_subclass__()
est appelée sur le parent immédiat de la nouvelle classe en utilisant l’ordre de résolution des méthodes.
Après la création de l’objet classe, il est passé aux décorateurs de la classe, y compris ceux inclus dans la définition de la classe (s’il y en a) et l’objet résultant est lié à l’espace de nommage local en tant que classe définie.
Quand une nouvelle classe est créée via type.__new__
, l’objet fourni en tant que paramètre d’espace de nommage est copié vers un nouveau tableau de correspondances ordonné et l’objet original est laissé de côté. La nouvelle copie est encapsulée dans un mandataire en lecture seule qui devient l’attribut __dict__
de l’objet classe.
Voir aussi
- PEP 3135 — Nouvelle méthode super
Décrit la référence à la fermeture (closure en anglais) de la
__class__
implicite
3.3.3.6. Uses for metaclasses¶
Les utilisations possibles des méta-classes sont immenses. Quelques pistes ont déjà été explorées comme l’énumération, la gestion des traces, le contrôle des interfaces, la délégation automatique, la création automatique de propriétés, les mandataires, les frameworks ainsi que le verrouillage ou la synchronisation automatique de ressources.
3.3.4. Personnalisation des instances et vérification des sous-classes¶
Les méthodes suivantes sont utilisées pour surcharger le comportement par défaut des fonctions natives isinstance()
et issubclass()
.
En particulier, la méta-classe abc.ABCMeta
implémente ces méthodes pour autoriser l’ajout de classes de base abstraites (ABC pour Abstract Base Classes en anglais) en tant que « classes de base virtuelles » pour toute classe ou type (y compris les types natifs).
-
class.
__instancecheck__
(self, instance)¶ Renvoie
True
si instance doit être considérée comme une instance (directe ou indirecte) de class. Si elle est définie, elle est appelée pour implémenterisinstance(instance, class)
.
-
class.
__subclasscheck__
(self, subclass)¶ Renvoie
True
si subclass doit être considérée comme une sous-classe (directe ou indirecte) de class. Si elle est définie, appelée pour implémenterissubclass(subclass, class)
.
Notez que ces méthodes sont recherchées dans le type (la méta-classe) d’une classe. Elles ne peuvent pas être définies en tant que méthodes de classe dans la classe réelle. C’est cohérent avec la recherche des méthodes spéciales qui sont appelées pour les instances, sauf qu’ici l’instance est elle-même une classe.
Voir aussi
- PEP 3119 — Introduction aux classes de bases abstraites
Inclut la spécification pour la personnalisation du comportement de
isinstance()
etissubclass()
à travers__instancecheck__()
et__subclasscheck__()
, avec comme motivation pour cette fonctionnalité l’ajout les classes de base abstraites (voir le moduleabc
) au langage.
3.3.5. Émulation d’objets appelables¶
-
object.
__call__
(self[, args...])¶ Appelée quand l’instance est « appelée » en tant que fonction ; si la méthode est définie,
x(arg1, arg2, ...)
est un raccourci pourx.__call__(arg1, arg2, ...)
.
3.3.6. Émulation de types conteneurs¶
Les fonctions suivantes peuvent être définies pour implémenter des objets conteneurs. Les conteneurs sont habituellement des séquences (telles que les tuples ou les listes) ou des tableaux de correspondances (comme les dictionnaires), mais ils peuvent aussi représenter d’autres conteneurs. Le premier ensemble de méthodes est utilisé soit pour émuler une séquence, soit pour émuler un tableau de correspondances ; la différence est que, pour une séquence, les clés doivent être soit des entiers k tels que 0 <= k < N
où N est la longueur de la séquence, soit des objets tranches qui définissent un intervalle d’éléments. Il est aussi recommandé que les tableaux de correspondances fournissent les méthodes keys()
, values()
, items()
, get()
, clear()
, setdefault()
, pop()
, popitem()
, copy()
et update()
avec un comportement similaire aux objets dictionnaires standards de Python. Le module collections
fournit une classe de base abstraite MutableMapping
pour aider à la création de ces méthodes à partir d’un ensemble de base composé de __getitem__()
, __setitem__()
, __delitem__()
et keys()
. Les séquences muables doivent fournir les méthodes append()
, count()
, index()
, extend()
, insert()
, pop()
, remove()
, reverse()
et sort()
, comme les objets listes standards de Python. Enfin, les types séquences doivent implémenter l’addition (dans le sens de la concaténation) et la multiplication (dans le sens de la répétition) en définissant les méthodes __add__()
, __radd__()
, __iadd__()
, __mul__()
, __rmul__()
et __imul__()
décrites ci-dessous ; ils ne doivent pas définir d’autres opérateurs numériques. Il est recommandé que les tableaux de correspondances et les séquences implémentent la méthode __contains__()
pour permettre l’utilisation efficace de l’opérateur in
; concernant les tableaux de correspondances, in
doit rechercher dans les clés du tableau ; pour les séquences, il doit chercher dans les valeurs. Il est de plus recommandé que les tableaux de correspondances et les séquences implémentent la méthode __iter__()
pour permettre une itération efficace dans le conteneur ; pour les tableaux de correspondances, __iter__()
doit être la même que keys()
; pour les séquences, elle doit itérer sur les valeurs.
-
object.
__len__
(self)¶ Appelée pour implémenter la fonction native
len()
. Elle doit renvoyer la longueur de l’objet, un entier>=
0. Par ailleurs, un objet qui ne définit pas de méthode__bool__()
et dont la méthode__len__()
renvoie zéro est considéré comme valantFalse
dans un contexte booléen.CPython implementation detail: En CPython, la longueur doit valoir au maximum
sys.maxsize
. Si la longueur est plus grande quesys.maxsize
, des propriétés (telles quelen()
) peuvent leverOverflowError
. Afin d’éviter de leverOverflowError
lors de tests booléens, un objet doit définir la méthode__bool__()
.
-
object.
__length_hint__
(self)¶ Appelée pour implémenter
operator.length_hint()
. Elle doit renvoyer une longueur estimée de l’objet (qui peut être plus grande ou plus petite que la longueur réelle). La longueur doit être un entier>=
0. Cette méthode est utilisée uniquement pour optimiser les traitements et n’est jamais tenue de renvoyer un résultat exact.Nouveau dans la version 3.4.
Note
Le découpage est effectué uniquement à l’aide des trois méthodes suivantes. Un appel comme
a[1:2] = b
est traduit en
a[slice(1, 2, None)] = b
et ainsi de suite. Les éléments manquants sont remplacés par None
.
-
object.
__getitem__
(self, key)¶ Appelée pour implémenter l’évaluation de
self[key]
. Pour les types séquences, les clés autorisées sont les entiers et les objets tranches (slice). Notez que l’interprétation spéciale des indices négatifs (si la classe souhaite émuler un type séquence) est du ressort de la méthode__getitem__()
. Si key n’est pas du bon type, uneTypeError
peut être levée ; si la valeur est en dehors de l’ensemble des indices de la séquence (après interprétation éventuelle des valeurs négatives), uneIndexError
doit être levée. Pour les tableaux de correspondances, si key n’existe pas dans le conteneur, uneKeyError
doit être levée.Note
for
s’attend à ce qu’uneIndexError
soit levée en cas d’indice illégal afin de détecter correctement la fin de la séquence.
-
object.
__setitem__
(self, key, value)¶ Appelée pour implémenter l’assignation à
self[key]
. La même note que pour__getitem__()
s’applique. Elle ne doit être implémentée que pour les tableaux de correspondances qui autorisent les modifications de valeurs des clés, ceux pour lesquels on peut ajouter de nouvelles clés ou, pour les séquences, celles dont les éléments peuvent être remplacés. Les mêmes exceptions que pour la méthode__getitem__()
doivent être levées en cas de mauvaises valeurs de clés.
-
object.
__delitem__
(self, key)¶ Appelée pour implémenter la suppression de
self[key]
. La même note que pour__getitem__()
s’applique. Elle ne doit être implémentée que pour les tableaux de correspondances qui autorisent les suppressions de clés ou pour les séquences dont les éléments peuvent être supprimés de la séquence. Les mêmes exceptions que pour la méthode__getitem__()
doivent être levées en cas de mauvaises valeurs de clés.
-
object.
__missing__
(self, key)¶ Appelée par
dict
.__getitem__()
pour implémenterself[key]
dans les sous-classes de dictionnaires lorsque la clé n’est pas dans le dictionnaire.
-
object.
__iter__
(self)¶ Cette méthode est appelée quand un itérateur est requis pour un conteneur. Cette méthode doit renvoyer un nouvel objet itérateur qui peut itérer sur tous les objets du conteneur. Pour les tableaux de correspondances, elle doit itérer sur les clés du conteneur.
Les objets itérateurs doivent aussi implémenter cette méthode ; ils doivent alors se renvoyer eux-mêmes. Pour plus d’information sur les objets itérateurs, lisez Les types itérateurs.
-
object.
__reversed__
(self)¶ Appelée (si elle existe) par la fonction native
reversed()
pour implémenter l’itération en sens inverse. Elle doit renvoyer un nouvel objet itérateur qui itère sur tous les objets du conteneur en sens inverse.Si la méthode
__reversed__()
n’est pas fournie, la fonction nativereversed()
se replie sur le protocole de séquence (__len__()
et__getitem__()
). Les objets qui connaissent le protocole de séquence ne doivent fournir__reversed__()
que si l’implémentation qu’ils proposent est plus efficace que celle dereversed()
.
Les opérateurs de tests d’appartenance (in
et not in
) sont normalement implémentés comme des itérations sur la séquence. Cependant, les objets conteneurs peuvent fournir les méthodes spéciales suivantes avec une implémentation plus efficace, qui ne requièrent d’ailleurs pas que l’objet soit une séquence.
-
object.
__contains__
(self, item)¶ Appelée pour implémenter les opérateurs de test d’appartenance. Elle doit renvoyer
True
si item est dans self etFalse
sinon. Pour les tableaux de correspondances, seules les clés sont considérées (pas les valeurs des paires clés-valeurs).Pour les objets qui ne définissent pas
__contains__()
, les tests d’appartenance essaient d’abord d’itérer avec__iter__()
puis avec le vieux protocole d’itération sur les séquences via__getitem__()
, reportez-vous à cette section dans la référence du langage.
3.3.7. Émulation de types numériques¶
Les méthodes suivantes peuvent être définies pour émuler des objets numériques. Les méthodes correspondant à des opérations qui ne sont pas autorisées pour la catégorie de nombres considérée (par exemple, les opérations bit à bit pour les nombres qui ne sont pas entiers) doivent être laissées indéfinies.
-
object.
__add__
(self, other)¶ -
object.
__sub__
(self, other)¶ -
object.
__mul__
(self, other)¶ -
object.
__matmul__
(self, other)¶ -
object.
__truediv__
(self, other)¶ -
object.
__floordiv__
(self, other)¶ -
object.
__mod__
(self, other)¶ -
object.
__divmod__
(self, other)¶ -
object.
__pow__
(self, other[, modulo])¶ -
object.
__lshift__
(self, other)¶ -
object.
__rshift__
(self, other)¶ -
object.
__and__
(self, other)¶ -
object.
__xor__
(self, other)¶ -
object.
__or__
(self, other)¶ Ces méthodes sont appelées pour implémenter les opérations arithmétiques binaires (
+
,-
,*
,@
,/
,//
,%
,divmod()
,pow()
,**
,<<
,>>
,&
,^
,|
). Par exemple, pour évaluer l’expressionx + y
, où x est une instance d’une classe qui possède une méthode__add__()
,x.__add__(y)
est appelée. La méthode__divmod__()
doit être l’équivalent d’appeler__floordiv__()
et__mod__()
; elle ne doit pas être reliée à__truediv__()
. Notez que__pow__()
doit être définie de manière à accepter un troisième argument optionnel si la version ternaire de la fonction nativepow()
est autorisée.Si l’une de ces méthodes n’autorise pas l’opération avec les arguments donnés, elle doit renvoyer
NotImplemented
.
-
object.
__radd__
(self, other)¶ -
object.
__rsub__
(self, other)¶ -
object.
__rmul__
(self, other)¶ -
object.
__rmatmul__
(self, other)¶ -
object.
__rtruediv__
(self, other)¶ -
object.
__rfloordiv__
(self, other)¶ -
object.
__rmod__
(self, other)¶ -
object.
__rdivmod__
(self, other)¶ -
object.
__rpow__
(self, other)¶ -
object.
__rlshift__
(self, other)¶ -
object.
__rrshift__
(self, other)¶ -
object.
__rand__
(self, other)¶ -
object.
__rxor__
(self, other)¶ -
object.
__ror__
(self, other)¶ Ces méthodes sont appelées pour implémenter les opérations arithmétiques binaires (
+
,-
,*
,@
,/
,//
,%
,divmod()
,pow()
,**
,<<
,>>
,&
,^
,|
) avec des opérandes renversés (intervertis). Ces fonctions ne sont appelées que si l’opérande de gauche n’autorise pas l’opération correspondante 3 et si les opérandes sont de types différents 4. Par exemple, pour évaluer l’expressionx - y
, où y est une instance d’une classe qui possède une méthode__rsub__()
,y.__rsub__(x)
est appelée six.__sub__(y)
renvoie NotImplemented.Notez que la fonction ternaire
pow()
n’essaie pas d’appeler__rpow__()
(les règles de coercition seraient trop compliquées).Note
Si le type de l’opérande de droite est une sous-classe du type de l’opérande de gauche et que cette sous-classe fournit la méthode symétrique pour l’opération, cette méthode sera appelée avant la méthode originelle de l’opérande gauche. Ce comportement permet à des sous-classes de surcharger les opérations de leurs ancêtres.
-
object.
__iadd__
(self, other)¶ -
object.
__isub__
(self, other)¶ -
object.
__imul__
(self, other)¶ -
object.
__imatmul__
(self, other)¶ -
object.
__itruediv__
(self, other)¶ -
object.
__ifloordiv__
(self, other)¶ -
object.
__imod__
(self, other)¶ -
object.
__ipow__
(self, other[, modulo])¶ -
object.
__ilshift__
(self, other)¶ -
object.
__irshift__
(self, other)¶ -
object.
__iand__
(self, other)¶ -
object.
__ixor__
(self, other)¶ -
object.
__ior__
(self, other)¶ Ces méthodes sont appelées pour implémenter les assignations arithmétiques augmentées (
+=
,-=
,*=
,@=
,/=
,//=
,%=
,**=
,<<=
,>>=
,&=
,^=
,|=
). Ces méthodes doivent essayer d’effectuer l’opération « sur place » (c’est-à-dire de modifier self) et de renvoyer le résultat (qui peut être, mais pas nécessairement, self). Si une méthode spécifique n’est pas définie, l’assignation augmentée se replie vers la méthode normale correspondante. Par exemple, si x est une instance d’une classe qui possède une méthode__iadd__()
,x += y
est équivalent àx = x.__iadd__(y)
. Sinon,x.__add__(y)
ety.__radd__(x)
sont essayées, comme pour l’évaluation dex + y
. Dans certaines situations, les assignations augmentées peuvent causer des erreurs inattendues (voir Pourquoi a_tuple[i] += ['item'] lève-t-il une exception alors que l’addition fonctionne ?), mais ce comportement est en fait partie intégrante du modèle de données.
-
object.
__neg__
(self)¶ -
object.
__pos__
(self)¶ -
object.
__abs__
(self)¶ -
object.
__invert__
(self)¶ Appelée pour implémenter les opérations arithmétiques unaires (
-
,+
,abs()
et~
).
-
object.
__complex__
(self)¶ -
object.
__int__
(self)¶ -
object.
__float__
(self)¶ Appelées pour implémenter les fonctions natives
complex()
,int()
etfloat()
. Elles doivent renvoyer une valeur du type approprié.
-
object.
__index__
(self)¶ Appelée pour implémenter
operator.index()
et lorsque Python a besoin de convertir sans perte un objet numérique en objet entier (pour un découpage ou dans les fonctions nativesbin()
,hex()
etoct()
). La présence de cette méthode indique que l’objet numérique est un type entier. Elle doit renvoyer un entier.Note
Afin d’avoir un type de classe entier cohérent, lorsque
__index__()
est définie alors__int__()
doit aussi être définie et les deux doivent renvoyer la même valeur.
-
object.
__round__
(self[, ndigits])¶ -
object.
__trunc__
(self)¶ -
object.
__floor__
(self)¶ -
object.
__ceil__
(self)¶ Appelée pour implémenter la fonction native
round()
et les fonctions du modulemath
trunc()
,floor()
etceil()
. À moins que ndigits ne soit passé à__round__()
, toutes ces méthodes doivent renvoyer la valeur de l’objet tronquée pour donner unIntegral
(typiquement unint
).Si
__int__()
n’est pas définie, alors la fonction nativeint()
se replie sur__trunc__()
.
3.3.8. Gestionnaire de contexte With¶
Un gestionnaire de contexte est un objet qui met en place un contexte prédéfini au moment de l’exécution de l’instruction with
. Le gestionnaire de contexte gère l’entrée et la sortie de ce contexte d’exécution pour tout un bloc de code. Les gestionnaires de contextes sont normalement invoqués en utilisant une instruction with
(décrite dans la section L’instruction with), mais ils peuvent aussi être directement invoqués par leurs méthodes.
Les utilisations classiques des gestionnaires de contexte sont la sauvegarde et la restauration d’états divers, le verrouillage et le déverrouillage de ressources, la fermeture de fichiers ouverts, etc.
Pour plus d’informations sur les gestionnaires de contexte, lisez Le type gestionnaire de contexte.
-
object.
__enter__
(self)¶ Entre dans le contexte d’exécution relatif à cet objet. L’instruction
with
lie la valeur de retour de cette méthode à une (ou plusieurs) cible spécifiée par la clauseas
de l’instruction, si elle est spécifiée.
-
object.
__exit__
(self, exc_type, exc_value, traceback)¶ Sort du contexte d’exécution relatif à cet objet. Les paramètres décrivent l’exception qui a causé la sortie du contexte. Si l’on sort du contexte sans exception, les trois arguments sont à
None
.Si une exception est indiquée et que la méthode souhaite supprimer l’exception (c’est-à-dire qu’elle ne veut pas que l’exception soit propagée), elle doit renvoyer
True
. Sinon, l’exception est traitée normalement à la sortie de cette méthode.Notez qu’une méthode
__exit__()
ne doit pas lever à nouveau l’exception qu’elle reçoit ; c’est du ressort de l’appelant.
3.3.9. Recherche des méthodes spéciales¶
Pour les classes définies par le développeur, l’invocation implicite de méthodes spéciales n’est garantie que si ces méthodes sont définies par le type d’objet, pas dans le dictionnaire de l’objet instance. Ce comportement explique pourquoi le code suivant lève une exception :
>>> class C:
... pass
...
>>> c = C()
>>> c.__len__ = lambda: 5
>>> len(c)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: object of type 'C' has no len()
La raison de ce comportement vient de certaines méthodes spéciales telles que __hash__()
et __repr__()
qui sont implémentées par tous les objets, y compris les objets types. Si la recherche effectuée par ces méthodes utilisait le processus normal de recherche, elles ne fonctionneraient pas si on les appelait sur l’objet type lui-même :
>>> 1 .__hash__() == hash(1)
True
>>> int.__hash__() == hash(int)
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: descriptor '__hash__' of 'int' object needs an argument
Essayer d’invoquer une méthode non liée d’une classe de cette manière est parfois appelé « confusion de méta-classe » et se contourne en shuntant l’instance lors de la recherche des méthodes spéciales :
>>> type(1).__hash__(1) == hash(1)
True
>>> type(int).__hash__(int) == hash(int)
True
En plus de shunter les attributs des instances pour fonctionner correctement, la recherche des méthodes spéciales implicites shunte aussi la méthode __getattribute__()
même dans la méta-classe de l’objet :
>>> class Meta(type):
... def __getattribute__(*args):
... print("Metaclass getattribute invoked")
... return type.__getattribute__(*args)
...
>>> class C(object, metaclass=Meta):
... def __len__(self):
... return 10
... def __getattribute__(*args):
... print("Class getattribute invoked")
... return object.__getattribute__(*args)
...
>>> c = C()
>>> c.__len__() # Explicit lookup via instance
Class getattribute invoked
10
>>> type(c).__len__(c) # Explicit lookup via type
Metaclass getattribute invoked
10
>>> len(c) # Implicit lookup
10
En shuntant le mécanisme de __getattribute__()
de cette façon, cela permet d’optimiser la vitesse de l’interpréteur moyennant une certaine manœuvre dans la gestion des méthodes spéciales (la méthode spéciale doit être définie sur l’objet classe lui-même afin d’être invoquée de manière cohérente par l’interpréteur).
3.4. Coroutines¶
3.4.1. Objets attendables (awaitables)¶
Un objet awaitable implémente généralement une méthode __await__()
. Les objets Coroutine renvoyés par les fonctions async def
sont des awaitables.
Note
Les objets itérateur de générateur renvoyés par les générateurs décorés par types.coroutine()
ou asyncio.coroutine()
sont aussi des awaitables, mais ils n’implémentent pas __await__()
.
-
object.
__await__
(self)¶ Doit renvoyer un itérateur. Doit être utilisé pour implémenter les objets awaitable. Par exemple,
asyncio.Future
implémente cette méthode pour être compatible avec les expressionsawait
.
Nouveau dans la version 3.5.
Voir aussi
PEP 492 pour les informations relatives aux objets awaitables.
3.4.2. Objets coroutines¶
Les objets Coroutine sont des objets awaitable. L’exécution d’une coroutine peut être contrôlée en appelant __await__()
et en itérant sur le résultat. Quand la coroutine a fini de s’exécuter et termine, l’itérateur lève StopIteration
et l’attribut value
de l’exception contient la valeur de retour. Si la coroutine lève une exception, elle est propagée par l’itérateur. Les coroutines ne doivent pas lever directement des exceptions StopIteration
non gérées.
Les coroutines disposent aussi des méthodes listées ci-dessous, analogues à celles des générateurs (voir Méthodes des générateurs-itérateurs). Cependant, au contraire des générateurs, vous ne pouvez pas itérer directement sur des coroutines.
Modifié dans la version 3.5.2: Utiliser await plus d’une fois sur une coroutine lève une RuntimeError
.
-
coroutine.
send
(value)¶ Démarre ou reprend l’exécution d’une coroutine. Si value est
None
, c’est équivalent à avancer l’itérateur renvoyé par__await__()
. Si value ne vaut pasNone
, cette méthode appelle la méthodesend()
de l’itérateur qui a causé la suspension de la coroutine. Le résultat (valeur de retour,StopIteration
ou une autre exception) est le même que lorsque vous itérez sur la valeur de retour de__await__()
, décrite ci-dessus.
-
coroutine.
throw
(type[, value[, traceback]])¶ Lève l’exception spécifiée dans la coroutine. Cette méthode délègue à la méthode
throw()
de l’itérateur qui a causé la suspension de la coroutine, s’il possède une telle méthode. Sinon, l’exception est levée au point de suspension. Le résultat (valeur de retour,StopIteration
ou une autre exception) est le même que lorsque vous itérez sur la valeur de retour de__await__()
, décrite ci-dessus. Si l’exception n’est pas gérée par la coroutine, elle est propagée à l’appelant.
-
coroutine.
close
()¶ Demande à la coroutine de faire le ménage et de se terminer. Si la coroutine est suspendue, cette méthode délègue d’abord à la méthode
close()
de l’itérateur qui a causé la suspension de la coroutine, s’il possède une telle méthode. Ensuite, elle lèveGeneratorExit
au point de suspension, ce qui fait le ménage dans la coroutine immédiatement. Enfin, la coroutine est marquée comme ayant terminé son exécution, même si elle n’a jamais démarré.Les objets coroutines sont automatiquement fermés en utilisant le processus décrit au-dessus au moment où ils sont détruits.
3.4.3. Itérateurs asynchrones¶
Un itérateur asynchrone est capable d’appeler du code asynchrone dans l’implémentation de son __aiter__
et peut appeler du code asynchrone dans sa méthode __anext__
.
Les itérateurs asynchrones peuvent être utilisés dans des instructions async for
.
-
object.
__aiter__
(self)¶ Doit renvoyer un objet itérateur asynchrone.
-
object.
__anext__
(self)¶ Doit renvoyer un awaitable qui se traduit par la valeur suivante de l’itérateur. Doit lever une
StopAsyncIteration
quand l’itération est terminée.
Un exemple d’objet itérateur asynchrone :
class Reader:
async def readline(self):
...
def __aiter__(self):
return self
async def __anext__(self):
val = await self.readline()
if val == b'':
raise StopAsyncIteration
return val
Nouveau dans la version 3.5.
Note
Modifié dans la version 3.5.2: À partir de CPython 3.5.2, __aiter__
peut directement renvoyer des itérateurs asynchrones. Renvoyer un objet awaitable entraine un avertissement PendingDeprecationWarning
.
La façon conseillée d’écrire du code compatible descendant en CPython 3.5.x est de continuer à renvoyer des awaitables avec __aiter__
. Si vous voulez éviter l’avertissement PendingDeprecationWarning et conserver un code compatible descendant, le décorateur suivant peut être utilisé :
import functools
import sys
if sys.version_info < (3, 5, 2):
def aiter_compat(func):
@functools.wraps(func)
async def wrapper(self):
return func(self)
return wrapper
else:
def aiter_compat(func):
return func
Exemple :
class AsyncIterator:
@aiter_compat
def __aiter__(self):
return self
async def __anext__(self):
...
À partir de CPython 3.6, le PendingDeprecationWarning
est remplacé par un DeprecationWarning
. Dans CPython 3.7, renvoyer un awaitable avec __aiter__
entraine une RuntimeError
.
3.4.4. Gestionnaires de contexte asynchrones¶
Un gestionnaire de contexte asynchrone est un gestionnaire de contexte qui est capable de suspendre son exécution dans ses méthodes __aenter__
et __aexit__
.
Les gestionnaires de contexte asynchrones peuvent être utilisés dans des instructions async with
.
-
object.
__aenter__
(self)¶ Cette méthode est sémantiquement équivalente à
__enter__()
, à la seule différence près qu’elle doit renvoyer un awaitable.
-
object.
__aexit__
(self, exc_type, exc_value, traceback)¶ Cette méthode est sémantiquement équivalente à
__exit__()
, à la seule différence près qu’elle doit renvoyer un awaitable.
Un exemple de classe de gestionnaire de contexte asynchrone :
class AsyncContextManager:
async def __aenter__(self):
await log('entering context')
async def __aexit__(self, exc_type, exc, tb):
await log('exiting context')
Nouveau dans la version 3.5.
Notes
- 1
Il est possible, dans certains cas, de changer le type d’un objet, sous certaines conditions. Cependant, ce n’est généralement pas une bonne idée car cela peut conduire à un comportement très étrange si ce n’est pas géré correctement.
- 2
Les méthodes
__hash__()
,__iter__()
,__reversed__()
et__contains__()
ont une gestion particulière pour cela ; les autres lèvent toujoursTypeError
, mais le font en considérant queNone
n’est pas un appelable.- 3
n’autorise pas signifie ici que la classe ne possède pas de méthode adéquate ou que la méthode renvoie
NotImplemented
. N’assignez pasNone
à la méthode si vous voulez un repli vers la méthode symétrique de l’opérande de droite — cela aurait pour effet de bloquer un tel repli.- 4
Pour des opérandes de même type, on considère que si la méthode originelle (telle que
__add__()
) échoue, l’opération n’est pas autorisée et donc la méthode symétrique n’est pas appelée.