import pandas as pd
# 使用 pandas 的 read_html 函数从 URL 或 HTML 文件中读取表格数据
# 这个函数会返回一个包含所有表格的列表,每个表格都是一个 DataFrame
# 示例:从 Wikipedia 读取表格
url = 'https://en.wikipedia.org/wiki/World_population'
tables = pd.read_html(url)
# 打印读取到的表格数量
print(f"Number of tables: {len(tables)}")
# 显示第一个表格的前几行
print(tables[0].head())
pd 作为别名。pd.read_html(url) 会从指定的 URL 中提取所有的 HTML 表格,并将它们存储在一个列表中。每个表格都是一个 pandas DataFrame。len(tables) 可以查看从网页中提取到的表格总数。tables[0].head() 用于显示第一个表格的前几行内容,帮助你快速预览数据。如果你希望直接从本地 HTML 文件读取表格,可以将 URL 替换为文件路径,例如:
tables = pd.read_html('path_to_your_file.html')
上一篇:html url
下一篇:html viewport
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站