Cordiales Saludos
Pandas nos permite tomar las tablas de una página web. Creo que es una buena forma de extraer información actualizada y de primera mano. El científico de datos buscará la fuente de los datos por cuaquier medio dependiendo el caso de estudio. Como en la actualidad la información fluye mayormente en internet, debemos estar preparados para estos casos particulares.
En esta ocasión tomaré los datos de la publicación:Daily Twitter Data Reports as of October 18, 2021 - 3,281 hive tweets of the day De la cuenta @hive-data . Ya hemos trabajamos con esta fuente de datos en varias publicación.
Comencemos
Importamos pandas y conectamos nuestro DRIVE
![9a.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/23tHZ6X3Bfoh9YcUEknD48yn74V48qf1nt7ZqNnzumXV4pux2zKAtpZq5GHfM1ecX2RMZ.png)
A continuación copiamos la dirección web de la página
![9b.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/Eo6RDfMx8RcDmSp3k2GahM4sqZohYMip2mefeciUWNov1gzsYz9jz3szqr9UrNSw4JG.png)
Colocamos la siguiente instrucción
#Dentro de las comillas pegamos la dirección web.
pd.read_html(' ')
df1 = pd.read_html('https://peakd.com/hive-197333/@hive-data/daily-twitter-data-reports-as-of-october-17-2021-2925-hive-tweets-of-the-day')
En esta ocación nos aparece el rror 403 del servidor. Esto se debe a que el servidor ha denegado la solicitud. Aprende del Error 403. No siempre ocurre pero muestro el error para que atequemos como podemos continuar con nuestra extracción de datos.
![9c.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/23tw9tKCHbwYgdBMNYneFoSJ1rPktX3N7iRb6sVF3PFKiPeZfyXbRh7yJt6WvmepcBkDL.png)
Solucionaremos esto descargando la web a nuestro computador con el menú contextual dentro de la web (descargamos [Guardar como...]) y luego la subimos a nuestro DRIVE
![9d.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/23viNsFyupk43zFqwVmEujLM7uhdJ5By3u4B33dDoNuRbJD6RrivYbiGNgUhjq7eS4zM5.png)
Copiamos la ruta de acceso
![9e.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/23xyriDYrQEUNZGinwEGUr9U6rA61pC7VpveYJApbtY2f2Vcm6eYCPjg6jXSVXQZ4U4WB.png)
pd.read_html(' ')
df = pd.read_html('/content/drive/MyDrive/Colab Notebooks/Data_Science/📊 Daily Twitter Data Reports as of October 18, 2021 🚀 3,281 hive tweets of the day 🚀 PeakD.htm')
Después de generar el Data Frame, podemos accesar a cada una de las tablas dentro de la web por medio de los subíndices comenzando por el cero.
![9f.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/Eo2AwKusLmLEzAyMfX75ZygRVN9dHe8eJVvkrpk33YxSNsLMTqyfvrrzEBxzHZiLnJ4.png)
Aquí la capture original tomada de la web
A continuación las tres ultimas tablas
![9h.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/Eo4JJnJ7xok8veCPR35WsiA2wBq385k8TtKxeX8CjchfwvPShgkbKDyq9A96veXJh2Y.png)
Todo lo tratado en esta publicación está en este Jupyter Notebook
![separador001.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/EoCgGMovbCnJBWcBvss5fTMZkcnGEH86toyuuDEZBwN8tQHrtnbNoLdCfWDxnvLMftZ.png)
Veamos este caso donde al colocar la dirección web no da el error 403.
![9k.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/23u6SbcUcyMYhS5N9p8D9aMrfjjRTfmK8akGteJyh9LRbSNn6THJc3Sptn2WPAFBXxHiZ.png)
Por útimo guardamos nuestro Data Frame con formato .csv para poder trabajar con el.
![9m.png](https://images.hive.blog/768x0/https://files.peakd.com/file/peakd-hive/rafaelaquino/Eo8Y3ng15BSp3oLiHpYu4xSfjEiJKV7EkXaNcYCubD2PKPS7wrB9i6jTsUHgTWiiZGs.png)
Ahora todas las operaciones que hagamos las hacemos accesando a nuestro archivo .csv guardado
Invitación Especial
Apreciada comunidad extiendo mi invitación, para todos los que hacemos vida en esta maravillosa comunidad, a participar con la etiqueta #Hive para promocionar nuestras publicaciones en la red social: #Twitter. Para más detalles puedes consultar la publicación de @hive-data
![hive_twitter_400.gif](https://images.hive.blog/DQmZ6EEGEvRnxbEZqFcrZzyocCvKs3EPrZYxDuUHJxpLVra/hive_twitter_400.gif)
Fuente:
![separador001.png](https://images.hive.blog/DQmdZJzKNb8zm5A26Bxemiw1KBwUcMnr31r87GrrEAVhwg5/separador001.png)
Entrega anterior
Operaciones matemáticas básicas y condicionales
Puedes practicar en esta web: PythonCumanés
![separador001.png](https://images.hive.blog/DQmdZJzKNb8zm5A26Bxemiw1KBwUcMnr31r87GrrEAVhwg5/separador001.png)
Clases gratis de programación / Free programming classes
[ESP/ENG] Mi proyecto en Python/My project in Python.
I started a Ko-fi Page! Ko-fi helps creators get support from fans of their work. Please support or follow my page! If you like what I do and feel in tune with my work in creating content for free programming courses and chess publications without any profit interest. Give me a coffee... I will be very grateful!
Todos a programar!
Rafael Aquino
follow me mate great content
The rewards earned on this comment will go directly to the person sharing the post on Twitter as long as they are registered with @poshtoken. Sign up at https://hiveposh.com.