### Spark Session

In [0]:
from pyspark.sql import SparkSession

spark = (
    SparkSession
        .builder
        .appName("HelloWorldStreaming")
        .getOrCreate()
)

### Read Stream

In [0]:
df_news = (
    spark.readStream
        .format("kafka")
        .option("kafka.bootstrap.servers", "localhost:9092,localhost:9095,localhost:9093")
        .option("subscribe", "topic_news")
        .load()
)

df_news

DataFrame[key: binary, value: binary, topic: string, partition: int, offset: bigint, timestamp: timestamp, timestampType: int]

### __Console

In [0]:
query = (
    df_news.writeStream
        .format("console")
        .outputMode("append")
        .start()
)

### Schema StructType

In [0]:
from pyspark.sql.functions import from_json, col
from pyspark.sql.types import StructType, StructField, StringType, NullType

source_schema = StructType([
    StructField("id", StringType()),
    StructField("name", StringType())
])
    
message_schema = StructType(
    [
        StructField("source", source_schema),
        StructField("author", StringType()),
        StructField("title", StringType()),
        StructField("description", StringType()),
        StructField("url", StringType()),
        StructField("urlToImage", StringType()),
        StructField("publishedAt", StringType()),
        StructField("content", StringType()),
    ]
)

df_news_data = df_news.withColumn("value", from_json(col("value").cast("STRING"), message_schema))

df_news_data = df_news_data.selectExpr("value.*")

df_news_data.writeStream.format("console").start()


### __Load


In [0]:
df_news_data.writeStream.format("parquet").option("checkpointLocation", "dbfs:/tmp/checkpoint").option("path", "dbfs:/tmp/output/raw/").start()

<pyspark.sql.streaming.query.StreamingQuery at 0x7ff63b2b3790>

### __Extract

In [0]:
spark.read.parquet("dbfs:/tmp/output/raw/").display()

source,author,title,description,url,urlToImage,publishedAt,content
"List(null, Tecmundo.com.br)",Jorge Marin,Google DeepMind: nova ferramenta de IA prevê doenças genéticas,Um novo programa de inteligência artificial desenvolvido por cientistas do Google DeepMind é capaz de prever se milhões de mutações genéticas presentes em nossa sequência de DNA que são inofensivas ou propensas a causar doenças no futuro. Batizada como AlphaM…,https://www.tecmundo.com.br/ciencia/271822-google-deepmind-nova-ferramenta-ia-preve-doencas-geneticas.htm,https://tm.ibxk.com.br/2023/09/20/20120248396161.jpg,2023-09-20T15:15:00Z,Um novo programa de inteligência artificial desenvolvido por cientistas do Google DeepMind é capaz de prever se milhões de mutações genéticas presentes em nossa sequência de DNA que são inofensivas o… [+2940 chars]
"List(null, Olhardigital.com.br)",Alessandro Di Lorenzo,Estudo descobre novas características genéticas do Alzheimer,"A descoberta, segundo os pesquisadores, pode contribuir para o desenvolvimento futuro de exames de sangue para a doença de Alzheimer O post Estudo descobre novas características genéticas do Alzheimer apareceu primeiro em Olhar Digital.",https://olhardigital.com.br/2023/09/07/medicina-e-saude/estudo-descobre-novas-caracteristicas-geneticas-do-alzheimer/,https://img.olhardigital.com.br/wp-content/uploads/2023/05/Alzheimer.jpg,2023-09-07T10:01:00Z,"Pesquisadores da Universidade de Pittsburgh, nos Estados Unidos, analisaram milhares de genomas humanos para encontrar novas variaÃ§Ãµes genÃ©ticas responsÃ¡veis por controlar os nÃ­veis de molÃ©cula… [+2542 chars]"
"List(null, Sapo.pt)",Ana Sofia Neto,Cérebro artificial ajuda a perceber as origens genéticas do autismo,Uma nova técnica científica está a revelar as origens genéticas da perturbação do espetro do autismo (ou PEA) escondidas no nosso cérebro. O cérebro é curiosamente complexo e há muito sobre ele que ainda...,https://pplware.sapo.pt/ciencia/cerebro-artificial-ajuda-a-perceber-as-origens-geneticas-do-autismo/,https://pplware.sapo.pt/wp-content/uploads/2023/09/organoide_cerebral00.jpg,2023-09-24T13:00:25Z,Uma nova técnica científica está a revelar as origens genéticas da perturbação do espetro do autismo (ou PEA) escondidas no nosso cérebro. O cérebro é curiosamente complexo e há muito sobre ele que … [+3282 chars]
"List(null, Tecmundo.com.br)",Jorge Marin,Miniórgãos descobertos em mamíferos podem gerar respostas autoimunes,"Pesquisadores do Instituto Federal Suíço de Tecnologia de Zurique descobriram recentemente um tipo de organela que havia permanecido não caracterizada até agora nas células dos mamíferos. O “miniórgão”, batizado como exclusoma, é feito de anéis de DNA chamado…",https://www.tecmundo.com.br/ciencia/272244-miniorgaos-descobertos-mamiferos-gerar-respostas-autoimunes.htm,https://tm.ibxk.com.br/2023/10/02/02154244691267.jpg,2023-10-02T20:30:04Z,Pesquisadores do Instituto Federal Suíço de Tecnologia de Zurique descobriram recentemente um tipo de organela que havia permanecido não caracterizada até agora nas células dos mamíferos. O miniórgão… [+3134 chars]
"List(null, Olhardigital.com.br)",Vitoria Lopes Gomez,"Vacinas erradicaram doenças que, antes, matavam mais que guerras","Doenças como a poliomielite e a varíola, que mataram milhões no século passado, desapareceram graças às vacinas O post Vacinas erradicaram doenças que, antes, matavam mais que guerras apareceu primeiro em Olhar Digital.",https://olhardigital.com.br/2023/09/08/medicina-e-saude/vacinas-erradicaram-doencas-que-antes-matavam-mais-que-guerras/,https://img.olhardigital.com.br/wp-content/uploads/2023/07/vacina-e1692890816557.jpg,2023-09-08T20:30:20Z,"NÃ£o Ã© incomum ouvir falar sobre a gravidade de doenÃ§as que hoje sequer nos lembramos. Ã o caso, por exemplo, da varÃ­ola e da poliomielite. Ambas mataram milhÃµes de pessoas no sÃ©culo passado, m… [+2308 chars]"
"List(null, Olhardigital.com.br)",Alessandro Di Lorenzo,IA brasileira é capaz de prever doenças com antecedência,"A IA Dara pode coletar dados e realizar uma rápida varredura em todo o histórico médico do paciente, indicando riscos de saúde O post IA brasileira é capaz de prever doenças com antecedência apareceu primeiro em Olhar Digital.",https://olhardigital.com.br/2023/09/29/medicina-e-saude/ia-brasileira-e-capaz-de-prever-doencas-com-antecedencia/,https://proxy.olhardigital.com.br/wp-content/uploads/2023/09/iStock-1411998514.jpg,2023-09-29T21:04:45Z,"Uma inteligÃªncia artificial desenvolvida por uma empresa brasileira pode ajudar a prevenir doenÃ§as como acidente vascular cerebral (AVC), infarto e diabetes, por exemplo. A Dara foi criada pela IPM… [+1959 chars]"
"List(null, Sapo.pt)",Rui Jorge,Cientistas adaptam a Realidade Virtual para utilização em consultas remotas,"Os investigadores da Universidade de Canterbury criaram um headset de realidade virtual (RV) que poderá ser utilizado pelos médicos para realizar avaliações médicas de pacientes que vivem em zonas rurais, têm doenças infeciosas ou...",https://pplware.sapo.pt/high-tech/cientistas-adaptam-a-realidade-virtual-para-utilizacao-em-consultas-remotas/,https://pplware.sapo.pt/wp-content/uploads/2023/09/rv_medicina.jpg,2023-09-20T14:00:25Z,Os investigadores da Universidade de Canterbury criaram um headset de realidade virtual (RV) que poderá ser utilizado pelos médicos para realizar avaliações médicas de pacientes que vivem em zonas ru… [+3368 chars]
"List(null, Olhardigital.com.br)",Flavia Correia,Bichos-da-seda transgênicos criam fibras mais resistentes do que tecido à prova de bala,"Usando engenharia genética, cientistas inseriram genes de aranha em bichos-da-seda para produção de tecidos mais resistentes do que Kevlar O post Bichos-da-seda transgênicos criam fibras mais resistentes do que tecido à prova de bala apareceu primeiro em Olha…",https://olhardigital.com.br/2023/09/26/ciencia-e-espaco/bichos-da-seda-transgenicos-criam-fibras-mais-resistentes-do-que-tecido-a-prova-de-bala/,https://proxy.olhardigital.com.br/wp-content/uploads/2023/09/bicho-da-seda.jpg,2023-09-26T19:18:52Z,"Cientistas utilizaram engenharia genÃ©tica para gerar bichos-da-seda capazes de produzir fibras mais resistentes do que o Kevlar, tambÃ©m chamado de poliaramida â material usado em coletes Ã prova… [+3623 chars]"
"List(null, Olhardigital.com.br)",Alessandro Di Lorenzo,Estudo indica onde fica o lar original da humanidade,"Pesquisadores criaram uma rede de quase 27 milhões de ancestrais, desenvolvendo uma gigantesca árvore genealógica da humanidade O post Estudo indica onde fica o lar original da humanidade apareceu primeiro em Olhar Digital.",https://olhardigital.com.br/2023/09/14/ciencia-e-espaco/estudo-indica-onde-fica-o-lar-original-da-humanidade/,https://img.olhardigital.com.br/wp-content/uploads/2022/03/deserto.jpg,2023-09-14T20:40:37Z,"A histÃ³ria da humanidade Ã© marcada pelas migraÃ§Ãµes. Por milhares de anos, nossa espÃ©cie se deslocou pela Terra em busca de Ã¡gua, alimentos e tudo o que proporciona uma vida melhor. Mas existe u… [+2407 chars]"
"List(null, Olhardigital.com.br)",Alessandro Di Lorenzo,Segundo transplante com coração de porco para humano é feito com sucesso,O coração de porco transplantado tem 10 modificações genéticas para reduzir o risco de ser recusado pelo corpo do paciente O post Segundo transplante com coração de porco para humano é feito com sucesso apareceu primeiro em Olhar Digital.,https://olhardigital.com.br/2023/09/22/medicina-e-saude/segundo-transplante-com-coracao-de-porco-para-humano-e-feito-com-sucesso/,https://proxy.olhardigital.com.br/wp-content/uploads/2023/09/Transplante-1.jpg,2023-09-22T19:33:57Z,"Pela segunda vez na histÃ³ria, cirurgiÃµes transplantaram o coraÃ§Ã£o de um porco em um homem na tentativa de prolongar sua vida. A operaÃ§Ã£o foi um sucesso e, dois dias depois, o paciente estava fa… [+2546 chars]"
