10. Σύντομη ξενάγηση στην Standard Βιβλιοθήκη
*********************************************


10.1. Διεπαφή Λειτουργικού Συστήματος
=====================================

Το module "os" παρέχει δεκάδες λειτουργίες για αλληλεπίδραση με το
λειτουργικό σύστημα:

   >>> import os
   >>> os.getcwd()      # Return the current working directory
   'C:\\Python310'
   >>> os.chdir('/server/accesslogs')   # Change current working directory
   >>> os.system('mkdir today')   # Run the command mkdir in the system shell
   0

Βεβαιωθείτε ότι χρησιμοποιείτε το στυλ "import os" αντί για το "from
os import *".  Αυτό θα κρατήσει το "os.open()" υπό τη σκίαση της
ενσωματωμένης συνάρτησης "open()" που λειτουργεί πολύ διαφορετικά.

Οι ενσωματωμένες συναρτήσεις "dir()" και "help()" είναι χρήσιμες ως
διαδραστικά βοηθήματα για εργασία με μεγάλα modules όπως "os":

   >>> import os
   >>> dir(os)
   <returns a list of all module functions>
   >>> help(os)
   <returns an extensive manual page created from the module's docstrings>

Για καθημερινές διαχειριστικές εργασίες σε αρχεία και καταλόγους, το
module "shutil" παρέχει μια διεπαφή υψηλότερου επιπέδου που είναι πιο
εύκολη στην χρήση:

   >>> import shutil
   >>> shutil.copyfile('data.db', 'archive.db')
   'archive.db'
   >>> shutil.move('/build/executables', 'installdir')
   'installdir'


10.2. Wildcard Αρχεία
=====================

Το module "glob" παρέχει μια λειτουργία για τη δημιουργία λιστών
αρχείων από αναζητήσεις με χαρακτήρες μπαλαντέρ καταλόγου:

   >>> import glob
   >>> glob.glob('*.py')
   ['primes.py', 'random.py', 'quote.py']


10.3. Ορίσματα γραμμής εντολών
==============================

Common utility scripts often need to process command line arguments.
These arguments are stored in the "sys" module's *argv* attribute as a
list.  For instance the following output results from running "python
demo.py one two three" at the command line:

   >>> import sys
   >>> print(sys.argv)
   ['demo.py', 'one', 'two', 'three']

Το module "argparse" παρέχει έναν πιο εξελιγμένο μηχανισμό για την
επεξεργασία ορισμάτων γραμμής εντολών.  Το ακόλουθο script εξάγει ένα
ή περισσότερα ονόματα αρχείων και έναν προαιρετικό αριθμό γραμμών που
θα εμφανιστούν:

   import argparse

   parser = argparse.ArgumentParser(
       prog='top',
       description='Show top lines from each file')
   parser.add_argument('filenames', nargs='+')
   parser.add_argument('-l', '--lines', type=int, default=10)
   args = parser.parse_args()
   print(args)

Όταν εκτελείται στη γραμμή εντολών το "python top.py --lines=5
alpha.txt beta.txt", το script ορίζει το "args.lines" σε "5" και το
"args.filenames" σε "['alpha.txt', 'beta.txt']".


10.4. Ανακατεύθυνση εξόδου σφάλματος και τερματισμός προγράμματος
=================================================================

Το module "sys" έχει επίσης χαρακτηριστικά για *stdin*, *stdout*, και
*stderr*. Το τελευταίο είναι χρήσιμο για την εκπομπή προειδοποιήσεων
και μηνυμάτων σφαλμάτων ώστε να είναι ορατά ακόμα και όταν το *stdout*
έχει ανακατευθυνθεί:

   >>> sys.stderr.write('Warning, log file not found starting a new one\n')
   Warning, log file not found starting a new one

Ο πιο άμεσος τρόπος για να τερματίσετε ένα script είναι να
χρησιμοποιήσετε το "sys.exit()".


10.5. Ταίριασμα μοτίβων συμβολοσειρών
=====================================

Το module "re" παρέχει εργαλεία κανονική έκφρασης για προηγμένη
επεξεργασία συμβολοσειρών. Για πολύπλοκη αντιστοίχιση και χειρισμό, οι
τυπικές εκφράσεις προσφέρουν συνοπτικές, βελτιστοποιημένες λύσεις:

   >>> import re
   >>> re.findall(r'\bf[a-z]*', 'which foot or hand fell fastest')
   ['foot', 'fell', 'fastest']
   >>> re.sub(r'(\b[a-z]+) \1', r'\1', 'cat in the the hat')
   'cat in the hat'

Όταν χρειάζονται μόνο απλές δυνατότητες, προτιμώνται οι μέθοδοι
συμβολοσειρών, επειδή είναι ευκολότερες στην ανάγνωση και τον
εντοπισμό σφαλμάτων:

   >>> 'tea for too'.replace('too', 'two')
   'tea for two'


10.6. Μαθηματικά
================

The "math" module gives access to the underlying C library functions
for floating point math:

   >>> import math
   >>> math.cos(math.pi / 4)
   0.70710678118654757
   >>> math.log(1024, 2)
   10.0

Το module "random" παρέχει εργαλεία για να κάνουμε τυχαίες επιλογές:

   >>> import random
   >>> random.choice(['apple', 'pear', 'banana'])
   'apple'
   >>> random.sample(range(100), 10)   # sampling without replacement
   [30, 83, 16, 4, 8, 81, 41, 50, 18, 33]
   >>> random.random()    # random float
   0.17970987693706186
   >>> random.randrange(6)    # random integer chosen from range(6)
   4

Το module "statistics" υπολογίζει βασικές στατιστικές ιδιότητες (μέσος
όρος, διάμεσος, διακύμανση, κ.λπ.) αριθμητικών δεδομένων:

   >>> import statistics
   >>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]
   >>> statistics.mean(data)
   1.6071428571428572
   >>> statistics.median(data)
   1.25
   >>> statistics.variance(data)
   1.3720238095238095

Το έργο SciPy <https://scipy.org> έχει πολλές άλλες ενότητες για
αριθμητικούς υπολογισμούς.


10.7. Πρόσβαση στο Διαδίκτυο
============================

Υπάρχει ένας αριθμός modules για πρόσβαση στο διαδίκτυο και
επεξεργασία πρωτοκόλλων διαδικτύου. Δύο από τα πιο απλά είναι το
"urllib.request" για να την ανάκτηση δεδομένων από διευθύνσεις URL και
το "smtplib" για την αποστολή αλληλογραφίας:

   >>> from urllib.request import urlopen
   >>> with urlopen('http://worldtimeapi.org/api/timezone/etc/UTC.txt') as response:
   ...     for line in response:
   ...         line = line.decode()             # Convert bytes to a str
   ...         if line.startswith('datetime'):
   ...             print(line.rstrip())         # Remove trailing newline
   ...
   datetime: 2022-01-01T01:36:47.689215+00:00

   >>> import smtplib
   >>> server = smtplib.SMTP('localhost')
   >>> server.sendmail('soothsayer@example.org', 'jcaesar@example.org',
   ... """To: jcaesar@example.org
   ... From: soothsayer@example.org
   ...
   ... Beware the Ides of March.
   ... """)
   >>> server.quit()

(Σημειώστε ότι το δεύτερο παράδειγμα χρειάζεται διακομιστή
αλληλογραφίας που εκτελείται σε localhost.)


10.8. Ημερομηνίες και ώρες
==========================

Το module "datetime" παρέχει κλάσεις για χειρισμό ημερομηνιών και ωρών
με απλούς και σύνθετους τρόπους. Ενώ υποστηρίζεται η αριθμητική
ημερομηνία και ώρα, η υλοποίηση εστιάζεται στην αποτελεσματική εξαγωγή
μελών για μορφοποίηση και χειρισμό εξόδου.  Το module επίσης
υποστηρίζει αντικείμενα που έχουν επίγνωση ζώνης ώρας.

   >>> # dates are easily constructed and formatted
   >>> from datetime import date
   >>> now = date.today()
   >>> now
   datetime.date(2003, 12, 2)
   >>> now.strftime("%m-%d-%y. %d %b %Y is a %A on the %d day of %B.")
   '12-02-03. 02 Dec 2003 is a Tuesday on the 02 day of December.'

   >>> # dates support calendar arithmetic
   >>> birthday = date(1964, 7, 31)
   >>> age = now - birthday
   >>> age.days
   14368


10.9. Συμπίεση Δεδομένων
========================

Οι συνήθεις μορφές αρχειοθέτησης και συμπίεσης δεδομένων
υποστηρίζονται άμεσα από modules όπως: "zlib", "gzip", "bz2", "lzma",
"zipfile" και "tarfile".

   >>> import zlib
   >>> s = b'witch which has which witches wrist watch'
   >>> len(s)
   41
   >>> t = zlib.compress(s)
   >>> len(t)
   37
   >>> zlib.decompress(t)
   b'witch which has which witches wrist watch'
   >>> zlib.crc32(s)
   226805979


10.10. Μέτρηση επίδοσης
=======================

Ορισμένοι χρήστες Python αναπτύσσουν βαθύ ενδιαφέρον να γνωρίζουν τη
σχετική απόδοση διαφορετικών προσεγγίσεων στο ίδιο πρόβλημα. Η Python
παρέχει ένα εργαλείο μέτρησης που απαντά σε αυτές τις ερωτήσεις
αμέσως.

Για παράδειγμα, μπορεί να είναι δελεαστικό να χρησιμοποιήσετε τη
δυνατότητα tuple packing και unpacking αντί της παραδοσιακής
προσέγγισης για την εναλλαγή ορισμάτων. Το module "timeit" δείχνει
γρήγορα ένα ταπεινό πλεονέκτημα απόδοσης:

   >>> from timeit import Timer
   >>> Timer('t=a; a=b; b=t', 'a=1; b=2').timeit()
   0.57535828626024577
   >>> Timer('a,b = b,a', 'a=1; b=2').timeit()
   0.54962537085770791

Σε αντίθεση με το λεπτό επίπεδο ευκρίνειας του "timeit", τα modules
"profile" και "pstats" παρέχουν εργαλεία για τον εντοπισμό κρίσιμων
χρονικών τμημάτων σε μεγαλύτερα μπλοκ κώδικα.


10.11. Έλεγχος ποιότητας
========================

Μια καλή προσέγγιση για την ανάπτυξη λογισμικού υψηλής ποιότητας είναι
να γράφονται tests για κάθε λειτουργία καθώς αναπτύσσεται και να
εκτελούνται συχνά αυτά τα tests κατά τη διαδικασία ανάπτυξης.

Το module "doctest" παρέχει ένα εργαλείο για τη σάρωση ενός module και
την επικύρωση tests που είναι ενσωματωμένες στις συμβολοσειρές
εγγράφων ενός προγράμματος.  Η κατασκευή του test είναι τόσο απλή όσο
η αποκοπή και επικόλληση μιας τυπικής κλήσης μαζί με τα αποτελέσματα
της στη συμβολοσειρά εγγράφων. Αυτό βελτιώνει την τεκμηρίωση
παρέχοντας στον χρήστη ένα παράδειγμα και επιτρέπει στην ενότητα
doctest να βεβαιωθεί ότι ο κώδικας παραμένει πιστός στην τεκμηρίωση:

   def average(values):
       """Computes the arithmetic mean of a list of numbers.

       >>> print(average([20, 30, 70]))
       40.0
       """
       return sum(values) / len(values)

   import doctest
   doctest.testmod()   # automatically validate the embedded tests

Το module "unittest" δεν είναι τόσο εύκολο όσο το module "doctest",
αλλά επιτρέπει τη διατήρηση ενός πιο ολοκληρωμένου συνόλου tests σε
ξεχωριστό αρχείο:

   import unittest

   class TestStatisticalFunctions(unittest.TestCase):

       def test_average(self):
           self.assertEqual(average([20, 30, 70]), 40.0)
           self.assertEqual(round(average([1, 5, 7]), 1), 4.3)
           with self.assertRaises(ZeroDivisionError):
               average([])
           with self.assertRaises(TypeError):
               average(20, 30, 70)

   unittest.main()  # Calling from the command line invokes all tests


10.12. Batteries Included
=========================

Η Python έχει μια φιλοσοφία "συμπεριλαμβάνονται μπαταρίες".  Αυτό
φαίνεται καλύτερα μέσα από τις εξελιγμένες και ισχυρές δυνατότητες των
μεγαλύτερων πακέτων της. Για παράδειγμα:

* Τα modules "xmlrpc.client" και "xmlrpc.server" καθιστούν την
  υλοποίηση κλήσεων απομακρυσμένων διαδικασιών σε μια σχεδόν ασήμαντη
  εργασία.  Παρά τα ονόματα των modules, δεν απαιτείται άμεση γνώση ή
  χειρισμός της XML.

* Το πακέτο "email" είναι μια βιβλιοθήκη για τη διαχείριση μηνυμάτων
  ηλεκτρονικού ταχυδρομείου, συμπεριλαμβανομένων MIME και άλλων
  μηνυμάτων εγγράφων που βασίζονται σε **RFC 2822**. Σε αντίθεση με τα
  "smtplib" και "poplib" που στην πραγματικότητα στέλνουν και
  λαμβάνουν μηνύματα, το πακέτο email έχει ένα πλήρες σύνολο εργαλείων
  για τη δημιουργία ή την αποκωδικοποίηση πολύπλοκων δομών μηνυμάτων
  (συμπεριλαμβανομένων των συνημμένων) και για την εφαρμογή
  κωδικοποίηση και πρωτόκολλο κεφαλίδων στο διαδίκτυο.

* Το πακέτο "json" παρέχει ισχυρή υποστήριξη για την ανάλυση αυτής της
  δημοφιλούς μορφής ανταλλαγής δεδομένων.  Το module "csv" υποστηρίζει
  την άμεση ανάγνωση και εγγραφή αρχείων σε μορφή τιμής διαχωρισμένου
  με κόμματα, που συνήθως υποστηρίζεται από βάσεις δεδομένων και
  υπολογιστικά φύλλα.  Η XML επεξεργασία υποστηρίζεται από τα πακέτα
  "xml.etree.ElementTree", "xml.dom" και "xml.sax". Μαζί, αυτές οι
  μονάδες και τα πακέτα απλοποιούν σημαντικά την ανταλλαγή δεδομένων
  μεταξύ εφαρμογών Python και άλλων εργαλείων.

* Το module "sqlite3" αποτελεί έναν wrapper για τη βιβλιοθήκη της
  βάσης δεδομένων SQLite, παρέχοντας μια συνεχής βάση δεδομένων που
  μπορεί να ενημερωθεί και να προσπελαστεί χρησιμοποιώντας ελαφρώς μη
  τυπική σύνταξη SQL.

* Η διεθνοποίηση υποστηρίζεται από έναν αριθμό modules,
  συμπεριλαμβανομένων των "gettext", "locale", και το πακέτο "codecs".
