import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
public class JavaSparkSQLExample {
public static void main(String[] args) {
// 创建一个 SparkSession,这是 Spark SQL 的入口点
SparkSession spark = SparkSession.builder()
.appName("Java Spark SQL Example")
.config("spark.some.config.option", "some-value")
.getOrCreate();
// 读取一个 JSON 文件并创建一个 DataFrame
Dataset<Row> df = spark.read().json("examples/src/main/resources/people.json");
// 显示 DataFrame 的内容
df.show();
// 注册临时视图以便使用 SQL 查询
df.createOrReplaceTempView("people");
// 使用 SQL 查询数据
Dataset<Row> sqlDF = spark.sql("SELECT * FROM people");
sqlDF.show();
// 停止 SparkSession
spark.stop();
}
}
SparkSession 是 Spark SQL 的入口点,用于读取数据、执行查询等操作。spark.read().json() 方法读取 JSON 文件,并将其转换为 DataFrame。df.show() 方法显示 DataFrame 的前几行数据。df.createOrReplaceTempView() 方法将 DataFrame 注册为临时视图,以便后续可以使用 SQL 查询。spark.sql() 方法执行 SQL 查询,并将结果存储在新的 DataFrame 中。spark.stop() 方法停止 SparkSession,释放资源。希望这段代码和解释对你有帮助!
上一篇:java switch enum
下一篇:java 线程等待
Laravel PHP 深圳智简公司。版权所有©2023-2043 LaravelPHP 粤ICP备2021048745号-3
Laravel 中文站