Todo el código usado en este tutorial ha sido escrito en Python. Este lenguaje de programación es, hoy en día, el preferido por la mayor parte de los científicos de datos. Y esta elección no es casual, y es que hay un cierto número de características de este lenguaje que lo destacan por encima de otras opciones:
- Se trata de un lenguaje de propósito general, por lo que su conocimiento nos permite aplicarlo a diferentes escenarios, más allá del Data Science.
- Es un lenguaje de alto nivel, lo que nos permite delegar en el intérprete la mayor parte del “trabajo sucio” (como la reserva y gestión de memoria), es fácil de leer y fácil de usar.
- Se trata de un lenguaje interpretado, lo que nos ofrece la interactividad que necesitamos para escribir código y probarlo con la agilidad requerida.
- A pesar de tratarse de un lenguaje interpretado, muchas de las librerías usadas en Data Science (todas las del stack científico, para empezar) están escritas en C, lo que asegura su eficiencia.
- Hay una cantidad inmensa de librerías disponibles para Python, muchas de las cuales no están disponibles para otros lenguajes.
- Hay una cantidad inmensa de recursos disponibles a los desarrolladores de este lenguaje: libros, canales especializados en YouTube, documentación en línea, cursos, blogs, etc.