parser

[Python] BeautifulSoup extrae código de una sopa de etiquetas HTML

19 diciembre 20138 septiembre 2021
Programación, Python

Es posible que como desarrollador te hayas enfrentado alguna vez al «reto» de extraer información (del tipo que sea) de una página web. Es muy sencillo cuando eres «humano», pero un robot… No, no es tan fácil. Imaginemos, por ejemplo que quisiéramos almacenar el número de artículos que tiene la Wikipedia en Español en un determinado momento. La forma más fácil es visitar la página destinada a tal efecto y, en la tabla, leer el número correspondiente y escribirlo (por ejemplo, en un archivo de texto). Pero la tarea se puede hacer muy tediosa (y de hecho lo es). Pero nosotros no estamos aquí para hacer un trabajo de chinos.… Leer más »[Python] BeautifulSoup extrae código de una sopa de etiquetas HTML

Cookie	Duración	Descripción
IDE	1 year 24 days	Used by Google DoubleClick and stores information about how the user uses the website and any other advertisement before visiting the website. This is used to present users with ads that are relevant to them according to the user profile.
test_cookie	15 minutes	This cookie is set by doubleclick.net. The purpose of the cookie is to determine if the user's browser supports cookies.
VISITOR_INFO1_LIVE	5 months 27 days	This cookie is set by Youtube. Used to track the information of the embedded YouTube videos on a website.

Cookie	Duración	Descripción
_ir		The cookie is set by Pinterest. We do not know the exact purpose of the cookies.
_koko_analytics_pages_viewed	6 hours	No description
_pk_id.1.3a40	1 year 27 days	No description
_pk_ses.1.3a40	30 minutes	No description
CONSENT	16 years 8 months 5 days 14 hours	No description
cookielawinfo-checkbox-functional	1 year	The cookie is set by GDPR cookie consent to record the user consent for the cookies in the category "Functional".
cookielawinfo-checkbox-others	1 year	No description
dekisession	10 years	No description
mtwebsession		No description