sourcecode

Spark java를 사용하여 mariadb에서 데이터를 읽는 방법

copyscript 2022. 9. 11. 17:28
반응형

Spark java를 사용하여 mariadb에서 데이터를 읽는 방법

Spark와 Java를 사용하여 MariaDB의 표를 읽어야 합니다.

데이터베이스에서 테이블 데이터를 읽을 수 있는 자바 코드를 작성했습니다.연결은 정상적으로 확립되었지만 데이터를 읽는 동안 오류가 발생합니다.테이블 데이터를 데이터 프레임으로 읽으려고 합니다.그러나 열 이름은 결과에서 열 값으로 표시됩니다.아래에 제시된 코드를 찾습니다.

import java.io.IOException;
import java.io.InputStream;
import java.util.Properties;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.Row;
import org.apache.spark.sql.SparkSession;
import static org.apache.spark.sql.functions.col;

public class mariadb_to_csv {    
public static void main(String[] args) {

    Properties prop = new Properties();
    String resourceName = "config.properties";
        ClassLoader loader = Thread.currentThread().getContextClassLoader();
        try(InputStream resourceStream = loader.getResourceAsStream(resourceName)) {
            prop.load(resourceStream);
        } catch (IOException e) {
            e.printStackTrace();
        }
    SparkSession spark = SparkSession.builder()
            .appName("Java Spark SQL basic example")
            .config("spark.some.config.option", "some-value").getOrCreate();

    Dataset<Row> jdbcDF = spark.read().format("jdbc")
            .option("url","url_address")
            .option("driver", "org.mariadb.jdbc.Driver")
            .option("dbtable", "source_table")
            .option("user", "username")
            .option("password", "password")
            .load();
    jdbcDF.select(col("code"), col("name"), col("isActive"), col("createdByUser"), col("modifiedByUser")).show();       


     }
     }  

그 결과 열 이름에는 열 값이 중복됩니다.

에러 이미지

이거 왜 이래?

maridb 커넥터에 문제가 있는 것 같습니다.호스트 URL을 "jdbc:mariadb://${Hostname}/${Database}"에서 "jdbc:mysql://${Hostname}:${Port}/${Database}"로 변경하면 문제가 해결되었습니다.

MariaDB와 Dataricks는 또한 Spark를 사용하여 Mariadb에서 데이터를 읽는 방법을 설명하기 위해 연결 URL로 "jdbc"를 사용했습니다.

  1. https://mariadb.com/kb/en/library/mariadb-columnstore-with-spark/ #syslog

  2. https://docs.databricks.com/spark/latest/data-sources/sql-databases.html

언급URL : https://stackoverflow.com/questions/52718788/how-to-read-data-from-mariadb-using-spark-java

반응형