Laravel  
laravel
文档
数据库
架构
入门
php技术
    
Laravelphp
laravel / php / java / vue / mysql / linux / python / javascript / html / css / c++ / c#

pandas read_html

作者:嗜神魔影   发布日期:2026-06-05   浏览:53

import pandas as pd

# 使用 pandas 的 read_html 函数从 URL 或 HTML 文件中读取表格数据
# 这个函数会返回一个包含所有表格的列表,每个表格都是一个 DataFrame

# 示例:从 Wikipedia 读取表格
url = 'https://en.wikipedia.org/wiki/World_population'
tables = pd.read_html(url)

# 打印读取到的表格数量
print(f"Number of tables: {len(tables)}")

# 显示第一个表格的前几行
print(tables[0].head())

解释说明:

  1. 导入 pandas:首先需要导入 pandas 库,通常使用 pd 作为别名。
  2. 读取 HTML 表格pd.read_html(url) 会从指定的 URL 中提取所有的 HTML 表格,并将它们存储在一个列表中。每个表格都是一个 pandas DataFrame。
  3. 打印表格数量:通过 len(tables) 可以查看从网页中提取到的表格总数。
  4. 显示第一个表格tables[0].head() 用于显示第一个表格的前几行内容,帮助你快速预览数据。

如果你希望直接从本地 HTML 文件读取表格,可以将 URL 替换为文件路径,例如:

tables = pd.read_html('path_to_your_file.html')

上一篇:html url

下一篇:html viewport

大家都在看

静态html源码

404 html

ios打开html

用于定义html文档所要显示内容的是

nginx访问不到html

html 符号

colspan在html中是什么意思

html iframe嵌套页面

怎么将网页另存为html

xml转html

Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3

Laravel 中文站