email.headerregistry
: Custom Header Objects¶
Code source : Lib/email/headerregistry.py
Ajouté dans la version 3.6: [1]
Les en-têtes sont représentés par des sous-classes personnalisées de str
. La classe particulière utilisée pour représenter un en-tête donné est déterminée par header_factory
de la policy
en vigueur lorsque les en-têtes sont créés. Cette section documente la header_factory
particulière implémentée par le paquet de messagerie pour la gestion des messages électroniques conformes à la RFC 5322, qui fournit non seulement des objets d'en-tête personnalisés pour différents types d'en-tête, mais fournit également un mécanisme d'extension permettant aux applications d'ajouter leurs propres types d'en-tête personnalisés.
Lors de l'utilisation de l'un des objets de définition de politique dérivés de EmailPolicy
, tous les en-têtes sont produits par HeaderRegistry
et ont BaseHeader
comme dernière classe mère. Chaque classe d'en-tête a une classe mère supplémentaire qui est déterminée par le type de l'en-tête. Par exemple, de nombreux en-têtes ont la classe UnstructuredHeader
comme autre classe mère. La deuxième classe spécialisée pour un en-tête est déterminée par le nom de l'en-tête, en utilisant un tableau de recherche stocké dans HeaderRegistry
. Tout cela est géré de manière transparente pour le programme d'application typique, mais des interfaces sont fournies pour modifier le comportement par défaut pour une utilisation par des applications plus complexes.
Les sections ci-dessous documentent d'abord les classes mères d'en-tête et leurs attributs, suivies de l'API pour modifier le comportement de HeaderRegistry
, et enfin les classes de gestion utilisées pour représenter les données analysées à partir d'en-têtes structurés.
- class email.headerregistry.BaseHeader(name, value)¶
name et value sont passés à
BaseHeader
à partir de l'appelheader_factory
. La valeur de chaîne de tout objet d'en-tête est la value entièrement décodée en Unicode.Cette classe mère définit les propriétés en lecture seule suivantes :
- name¶
Nom de l'en-tête (la partie du champ avant le
:
). C'est exactement la valeur passée dans l'appelheader_factory
pour name ; c'est-à-dire que la casse est préservée.
- defects¶
n-uplet d'instances
HeaderDefect
signalant tout problème de conformité avec les RFC détecté lors de l'analyse. Le paquet d'e-mails tente d'être complet en ce qui concerne la détection des problèmes de conformité. Voir le moduleerrors
pour une discussion sur les types de défauts qui peuvent être signalés.
- max_count¶
Nombre maximum d'en-têtes de ce type pouvant avoir le même
name
. Une valeur deNone
signifie illimité. La valeurBaseHeader
pour cet attribut estNone
; les classes d'en-tête spécialisées sont censées remplacer cette valeur si nécessaire.
BaseHeader
fournit également la méthode suivante, qui est appelée par le code de la bibliothèque de messagerie et ne doit généralement pas être appelée par les programmes d'application :- fold(*, policy)¶
Renvoie une chaîne contenant les caractères
linesep
nécessaires pour remettre en forme correctement l'en-tête conformément à policy. Uncte_type
de8bit
est traité comme s'il s'agissait de7bit
, car les en-têtes ne peuvent pas contenir de données binaires arbitraires. Siutf8
estFalse
, les données non-ASCII seront encodées selon la RFC 2047.
BaseHeader
seule ne peut pas être utilisée pour créer un objet d'en-tête. Elle définit un protocole avec lequel chaque en-tête spécialisé coopère afin de produire l'objet d'en-tête. Plus précisément,BaseHeader
nécessite que la classe spécialisée fournisse uneclassmethod()
nomméeparse
. Cette méthode s'appelle comme suit :parse(string, kwds)
kwds
est un dictionnaire contenant une clé pré-initialisée :defects
.defects
est une liste vide. La méthode d'analyse doit ajouter tous les défauts détectés à cette liste. Au retour, le dictionnairekwds
doit contenir des valeurs pour au moins les clésdecoded
etdefects
.decoded
doit être la valeur de la chaîne pour l'en-tête (c'est-à-dire la valeur de l'en-tête entièrement décodée en Unicode). La méthode d'analyse doit supposer que string peut contenir des parties codées par transfert de contenu, mais doit également gérer correctement tous les caractères Unicode valides afin de pouvoir analyser les valeurs d'en-tête non codées.__new__
deBaseHeader
crée ensuite l'instance d'en-tête et appelle sa méthodeinit
. La classe spécialisée n'a besoin de fournir une méthodeinit
que si elle souhaite définir des attributs supplémentaires au-delà de ceux fournis parBaseHeader
lui-même. Une telle méthodeinit
devrait ressembler à ceci :def init(self, /, *args, **kw): self._myattr = kw.pop('myattr') super().init(*args, **kw)
Autrement dit, tout ce que la classe spécialisée ajoute au dictionnaire
kwds
doit être supprimé et géré, et le contenu restant dekw
(etargs
) est passé à la méthodeinit
deBaseHeader
.
- class email.headerregistry.UnstructuredHeader¶
Un en-tête « non structuré » est le type d'en-tête par défaut dans la RFC 5322. Tout en-tête qui n'a pas de syntaxe spécifiée est traité comme non structuré. L'exemple classique d'en-tête non structuré est l'en-tête Subject.
Dans la RFC 5322, un en-tête non structuré est une séquence de texte arbitraire dans le jeu de caractères ASCII. RFC 2047, cependant, possède un mécanisme compatible RFC 5322 pour encoder du texte non-ASCII en tant que caractères ASCII dans une valeur d'en-tête. Lorsqu'une value contenant des mots encodés est passée au constructeur, l'analyseur
UnstructuredHeader
convertit ces mots encodés en Unicode, en suivant les règles de la RFC 2047 pour le texte non structuré. L'analyseur utilise des heuristiques pour tenter de décoder certains mots codés non conformes. Des défauts sont enregistrés dans de tels cas, ainsi que des défauts pour des problèmes tels que des caractères non valides dans les mots codés ou le texte non codé.Ce type d'en-tête ne fournit aucun attribut supplémentaire.
- class email.headerregistry.DateHeader¶
La RFC 5322 spécifie un format très spécifique pour les dates dans les en-têtes de courrier électronique. L'analyseur
DateHeader
reconnaît ce format de date, ainsi qu'un certain nombre de formes variantes que l'on trouve parfois « dans la nature ».Ce type d'en-tête fournit les attributs supplémentaires suivants :
- datetime¶
Si la valeur d'en-tête peut être reconnue comme une date valide d'une forme ou d'une autre, cet attribut contient une instance
datetime
représentant cette date. Si le fuseau horaire de la date d'entrée est spécifié comme-0000
(indiquant qu'il est en UTC mais ne contient aucune information sur le fuseau horaire source), alorsdatetime
est unedatetime
naïve. Si un décalage de fuseau horaire spécifique est trouvé (y compris+0000
), alorsdatetime
contient undatetime
avisé qui utilisedatetime.timezone
pour enregistrer le décalage lié au fuseau horaire.
La valeur
decoded
de l'en-tête est déterminée en formatant ledatetime
selon les règles de la RFC 5322 ; c'est-à-dire qu'elle est définie sur :email.utils.format_datetime(self.datetime)
Lors de la création d'un
DateHeader
, value peut être une instance dedatetime
. Cela signifie, par exemple, que le code suivant est valide et fait ce à quoi on pourrait s'attendre :msg['Date'] = datetime(2011, 7, 15, 21)
Comme il s'agit d'un
datetime
naïf, il est interprété comme un horodatage UTC et la valeur résultante a un fuseau horaire de-0000
. Il est beaucoup plus utile d'utiliser la fonctionlocaltime()
du moduleutils
:msg['Date'] = utils.localtime()
Cet exemple définit l'en-tête de date sur l'heure et la date actuelles à l'aide du décalage horaire actuel.
- class email.headerregistry.AddressHeader¶
Les en-têtes d'adresse sont l'un des types d'en-têtes structurés les plus complexes. La classe
AddressHeader
fournit une interface générique à n'importe quel en-tête d'adresse.Ce type d'en-tête fournit les attributs supplémentaires suivants :
- groups¶
n-uplet d'objets
Group
encodant les adresses et les groupes trouvés dans la valeur d'en-tête. Les adresses qui ne font pas partie d'un groupe sont représentées dans cette liste comme desGroups
à adresse unique dontdisplay_name
estNone
.
- addresses¶
n-uplet d'objets
Address
encodant toutes les adresses individuelles à partir de la valeur d'en-tête. Si la valeur d'en-tête contient des groupes, les adresses individuelles du groupe sont incluses dans la liste au point où le groupe apparaît dans la valeur (c'est-à-dire que la liste d'adresses est « aplatie » en une liste unidimensionnelle).
La valeur
decoded
de l'en-tête a tous les mots codés décodés en Unicode. Les noms de domaine encodés enidna
sont également décodés en Unicode. La valeurdecoded
est définie en joignant la valeurstr
des éléments de l'attributgroups
avec', '
.Une liste d'objets
Address
etGroup
dans n'importe quelle combinaison peut être utilisée pour définir la valeur d'un en-tête d'adresse. Les objetsGroup
dont ledisplay_name
estNone
sont interprétés comme des adresses uniques, ce qui permet de copier une liste d'adresses avec des groupes intacts en utilisant la liste obtenue à partir de l'attributgroups
de l'en-tête source.
- class email.headerregistry.SingleAddressHeader¶
Sous-classe de
AddressHeader
qui ajoute un attribut supplémentaire :- address¶
Adresse unique codée par la valeur d'en-tête. Si la valeur d'en-tête contient en fait plus d'une adresse (ce qui serait une violation de la RFC sous la valeur par défaut
policy
), l'accès à cet attribut lève uneValueError
.
La plupart des classes ci-dessus ont également une variante Unique
(par exemple, UniqueUnstructuredHeader
). La seule différence est que dans la variante Unique
, max_count
est définie sur 1.
- class email.headerregistry.MIMEVersionHeader¶
Il n'y a vraiment qu'une seule valeur valide pour l'en-tête MIME-Version, et c'est
1.0
. Au cas où, cette classe d'en-tête prend en charge d'autres numéros de version valides. Si un numéro de version a une valeur valide selon la RFC 2045, alors l'objet d'en-tête a des valeurs autres queNone
pour les attributs suivants :- version¶
Numéro de version sous forme de chaîne, sans espaces ni commentaires.
- major¶
Numéro de version majeure sous forme d'entier
- minor¶
Numéro de version mineure sous forme d'entier
- class email.headerregistry.ParameterizedMIMEHeader¶
Les en-têtes MIME commencent tous par le préfixe
'Content-'
. Chaque en-tête spécifique a une certaine valeur, décrite par la classe de cet en-tête. Certains peuvent également prendre une liste de paramètres supplémentaires, qui ont un format commun. Cette classe sert de base à tous les en-têtes MIME qui prennent des paramètres.- params¶
Dictionnaire de correspondance entre les noms de paramètres et leurs valeurs.
- class email.headerregistry.ContentTypeHeader¶
Classe
ParameterizedMIMEHeader
qui gère l'en-tête Content-Type.- content_type¶
Chaîne de type de contenu, sous la forme
maintype/subtype
.
- maintype¶
- subtype¶
- class email.headerregistry.ContentDispositionHeader¶
Classe
ParameterizedMIMEHeader
qui gère l'en-tête Content-Disposition.- content_disposition¶
inline
etattachment
sont les seules valeurs valides couramment utilisées.
- class email.headerregistry.ContentTransferEncoding¶
Gère l'en-tête Content-Transfer-Encoding.
- class email.headerregistry.HeaderRegistry(base_class=BaseHeader, default_class=UnstructuredHeader, use_default_map=True)¶
C'est la fabrique utilisée par
EmailPolicy
par défaut.HeaderRegistry
construit la classe utilisée pour créer dynamiquement une instance d'en-tête, en utilisant base_class et une classe spécialisée récupérée à partir d'un registre qu'il contient. Lorsqu'un nom d'en-tête donné n'apparaît pas dans le registre, la classe spécifiée par default_class est utilisée comme classe spécialisée. Lorsque use_default_map estTrue
(valeur par défaut), la correspondance standard des noms d'en-tête aux classes est copiée dans le registre lors de l'initialisation. base_class est toujours la dernière classe dans la liste__bases__
de la classe générée.Les correspondances par défaut sont :
- subject:
UniqueUnstructuredHeader
- date:
UniqueDateHeader
- resent-date:
DateHeader
- orig-date:
UniqueDateHeader
- sender:
UniqueSingleAddressHeader
- resent-sender:
SingleAddressHeader
- to:
UniqueAddressHeader
- resent-to:
AddressHeader
- cc:
UniqueAddressHeader
- resent-cc:
AddressHeader
- bcc:
UniqueAddressHeader
- resent-bcc:
AddressHeader
- from:
UniqueAddressHeader
- resent-from:
AddressHeader
- reply-to:
UniqueAddressHeader
- mime-version:
MIMEVersionHeader
- content-type:
ContentTypeHeader
- content-disposition:
ContentDispositionHeader
- content-transfer-encoding:
ContentTransferEncodingHeader
- message-id:
MessageIDHeader
HeaderRegistry
a les méthodes suivantes :- map_to_type(self, name, cls)¶
name est le nom de l'en-tête à faire correspondre. Il est converti en minuscules dans le registre. cls est la classe spécialisée à utiliser, avec base_class, pour créer la classe utilisée pour instancier les en-têtes qui correspondent à name.
- __getitem__(name)¶
Construit et renvoie une classe pour gérer la création d'un en-tête name.
- __call__(name, value)¶
Récupère l'en-tête spécialisé associé à name du registre (en utilisant default_class si name n'apparaît pas dans le registre) et le compose avec base_class pour produire une classe, appelle le constructeur de la classe construite, en lui passant la même liste d'arguments, et renvoie enfin l'instance de classe ainsi créée.
Les classes suivantes sont les classes utilisées pour représenter les données analysées à partir d'en-têtes structurés et peuvent, en général, être utilisées par un programme d'application pour construire des valeurs structurées à affecter à des en-têtes spécifiques.
- class email.headerregistry.Address(display_name='', username='', domain='', addr_spec=None)¶
Classe utilisée pour représenter une adresse e-mail. La forme générale d'une adresse est :
[display_name] <username@domain>
ou :
username@domain
où chaque partie doit se conformer à des règles de syntaxe spécifiques énoncées dans la RFC 5322.
Pour plus de commodité, addr_spec peut être spécifié à la place de username et domain, username et domain sont alors analysés à partir de addr_spec. Une addr_spec doit être une chaîne correctement entre guillemets RFC ; si ce n'est pas le cas,
Address
lève une erreur. Les caractères Unicode sont autorisés et sont encodés proprement lors de la sérialisation. Cependant, selon les RFC, l’Unicode n'est pas autorisé dans la partie nom d'utilisateur de l'adresse.- display_name¶
Partie du nom d'affichage de l'adresse, le cas échéant, avec toutes les citations supprimées. Si l'adresse n'a pas de nom d'affichage, cet attribut est une chaîne vide.
- username¶
Partie
username
de l'adresse, sans guillemets.
- domain¶
Partie
domain
de l'adresse.
- addr_spec¶
Partie
username@domain
de l'adresse, correctement citée pour une utilisation en tant qu'adresse nue (la deuxième forme illustrée ci-dessus). Cet attribut n'est pas modifiable.
- __str__()¶
La valeur
str
de l'objet est l'adresse entre guillemets selon les règles de la RFC 5322, mais sans encodage de contenu pour les caractères non-ASCII.
Pour prendre en charge SMTP (RFC 5321),
Address
gère un cas particulier : siusername
etdomain
sont tous deux la chaîne vide (ouNone
), alors la valeur de chaîne deAddress
est<>
.
- class email.headerregistry.Group(display_name=None, addresses=None)¶
Classe utilisée pour représenter un groupe d'adresses. La forme générale d'un groupe d'adresses est :
display_name: [address-list];
Pour faciliter le traitement des listes d'adresses composées d'un mélange de groupes et d'adresses uniques, un
Group
peut également être utilisé pour représenter des adresses uniques qui ne font pas partie d'un groupe en définissant display_name surNone
et en fournissant une liste de l'adresse unique sous la forme adresses.- display_name¶
display_name
du groupe. Si c'estNone
et qu'il y a exactement uneAdress
dansadresses
, alors leGroup
représente une seule adresse qui n'est pas dans un groupe.
Notes