Repetir en nuestros programas una y otra vez el mismo código no es eficiente, ni lo es tampoco el querer programar rutinas que ya han sido programadas y probadas por terceros. Python nos permite acceder a dichas rutinas en forma de librerías o módulos. Una vez que importamos una librería a nuestro programa, podemos hacer uso de toda su funcionalidad como si fuese parte de nuestro programa.
Hay cientos (o miles) de librerías disponibles para Python. Si estás usando Jupyter sobre Anaconda, éste último entorno ofrece cientos de librerías para descargar e importar. Aquí tienes, por ejemplo, el listado de librerías disponibles para Python 3.8 sobre Windows 64-bits. Incluso nosotros mismos podemos crear nuestras propias librerías y hacerlas públicas o simplemente usarlas desde nuestros programas.
La forma más básica de importar una librería (que esté instalada en nuestro equipo) es usando la palabra reservada import seguida del nombre de la librería (esto deberá hacerse antes de intentar usar alguna función de dicha librería, lógicamente):
En este ejemplo estamos importando la librería math. A partir de este momento podremos hacer uso de las funciones y objetos de esta librería escribiéndolos precediendo su nombre con el nombre de la librería seguido de un punto. Por ejemplo, podemos usar math.pi para acceder a la constante pi contenida en math:
Una librería también puede ser importada usando un alias. En este caso tendremos que hacer referencia a las funciones y objetos ofrecidos por la librería precediendo sus nombres con el alias que hayamos definido:
En la imagen anterior hemos importando la librería NumPy con el alias np. Si queremos ejecutar, por ejemplo, la función identity de NumPy deberemos invocarla usando la instrucción np.identity():
Aunque en este momento es irrelevante la funcionalidad de la función numpy.identity, si tienes curiosidad deberás saber que crea una estructura bidimensional cuadrada llamada array con ceros en todos los valores menos en la diagonal principal (una matriz identidad).
Hay librerías que siempre se importan con los mismos alias. NumPy es una de ellas: siempre se importa con el alias np. pandas es otra de las librerías más importantes en análisis de datos, siempre se importa con el alias pd...
Podemos incluso no importar toda la librería sino solo una función o un objeto. Si sabemos, por ejemplo, que de la librería math solo vamos a usar la constante pi, y no ninguna otra funcionalidad, podemos importar solo esta constante con el siguiente código:
En un caso como éste haremos uso del objeto importado sin precederlo del nombre de la librería (lo que daría un error, por otro lado):
A continuación revisaremos las librerías más usadas en Data Science así como tres librerías proveídas por Python: math, random y statistics.