Joviano

Categoria: Python

Queimadas no Brasil nos anos de 2012 a 2019

Queimadas no Brasil nos anos de 2012 a 2019

Ola pessoal, vamos hoje falar de um tema que está em alta no noticiário, que são as queimadas no Brasil. Essas queimadas não são exclusivas de hoje, mas, ao que nos consta, a midia tem trazido à tônica da atenção quanto a isso. Esse artigo (acompanhado do script Python) não vão defender politicos, e elaborar teses sobre aquecimento global e final dos tempos…e sim, vamos aproveitar a oportunidade para aprender mais um pouco de Python. O conjunto de dados fornecido pelo governo está em formato de tabela, mas carece de uma boa limpeza para tornar legível para leitura e analise. Quer ver? Olha só! Viu só? Após a limpeza dos dados com nosso amigo pandas, obtivemos nosso primeiro insight, que é a representatividade de cada estado quanto às queimadas. Aonde podemos visualizar os vilões da história recente: Isso nos levou a perguntar qual a evolução desses numeros ao longo dos anos, utilizando o gráfico de linhas, pudemos visualizar, e evolução dos dados (totais) apresentados pelo governo: Era o que precisávamos para ascender a luz da desconfiança para os dados, aonde é muito, mas muito estranho, os anos de 2013 e 2018 ter uma queda tão abupta no volume de queimadas. Após calcular a média móvel dos 4 estados com maior quantidade de queimadas, imprimimos o gráfico de linhas, só que agora aberto por estados, e ao que nos parece, as informações de queimadas foram deslocadas ou para 2017 ou para 2019. Veja a seguir o gráfico com média móvel (4 anos) e sem: SEM MÉDIA MÓVEL COM MÉDIA MÓVEL (4 ANOS) Com esse último gráfico vimos que Mato Grosso (MT) está crescendo e indo ao encontro do estado do Piauí, que até então ocupa primeira posição. Em seguida comparamos a área INFORMADA como queimada, com o total informado como reserva natural, e vimos que as posições no ranking se inverteram drasticamente: Isso nos levou a pensar que ou os dados estão com unidades de medidas diferentes (no dataset original), ou são informadas queimadas em áreas que não são de reserva, e atreladas às reservas. Infelizmente não temos como saber o que é o correto, pois a documentação não menciona isso. E por fim, comparamos a soma da área total das reservas com a soma da área total queimada, e vimos que a situação sim, é bem alarmante, se pensarmos que os dados são de 2012 a 2019 (8 anos): Concluindo o estudo de queimadas no Brasil entre os anos de 2012 e 2019 Mas, esses 36% podem ser muito menos, caso a unidade de medida seja diferente (queira Deus que seja). Outro fato que pode nos deixar um pouco tranquilos (ou não) é o fato do reflorestamento, ou seja, qual o tamanho de área recuperada ao longo desses mesmos anos? Quem sabe no futuro alguem de vocês não consigam essa informação, e possam responder essa pergunta à comunidade. Todo o script Python, focado na sua compreensão está disponível no GITHUB e GOOGLECOLAB, e sugiro você fazer uma cópia, e faça anotação nos pontos que aprendeu com ele, pois, quando eu elaborei, pensei justamente em você poder aproveitar os conceitos para resolver outros problemas do seu dia-a-dia. Espero que tenham curtido o artigo de hoje, e não deixem de conhecer mais sobre meu trabalho, clicando nos links no final dessa página. Forte Abraço

Do Webscraping com Python ao painel do Power BI

Do Webscraping com Python ao painel do Power BI

Foi um mês repleto de desafios, em um projeto diferente, aonde me propus em trazer uma série de aulas, resultando em um projeto de BI completo.Partimos do Webscraping com Python, incluímos os dados em banco SQL, e depois consumimos estes dados em um lindo painel do Power BI. Esse projeto é alusivo, e comemorativo à marca de 5 mil alunos, e ao mesmo tempo, 5 mil seguidores no LinkedIn. São 4 aulas que totalizam aproximadamente 8 horas, de material ultra detalhado focado 100% no projeto, e sem “firulas”. Todas essas aulas geram um material de apoio, que também está disponível no LINK acima, e totalmente gratuito. Apenas para gerar o certificado, caso você desejar, há um custo simbólico. Mas WebScraping no Python? Por que se o Power BI faz isso?!?!?! O Power Query (do Power BI e do Excel) faz sim WebScraping (raspagem de dados na Internet), mas, possui certas limitações, e o pior, é que cada atualização reexecuta a raspagem em todas as páginas. Claro que você poderia fazer uma inserção de dados no Banco, mas seria um pouco custoso. Por isso que estamos aproveitando e trazendo a opção de fazer isso via Python, pois tem uma quantidade de ferramentas e opções maior que o Power Query, tornando o trabalho mais tranquilo e com muito mais opções. Outra vantagem, é que com Python, o algoritmo pode ser executado em servidor LINUX (por exemplo). Você já conhece Python? Não? Eu te ajudo! Se você não conhece Python, fique tranquilo pois você pode optar por iniciar este treinamento pelo meu CURSO GRATUITO de Lógica de Programação com Python, ou, pode tentar acompanhar “na cara e na coragem”, pois eu organizei o conteúdo bem “be a bá”. O Link para este conteúdo está dentro do material de apoio. Concluindo Com esse material, você vai ter um mix de linguagens resolvendo um baita de um “problema de negócio”, altamente replicável no seu dia a dia. Imagine você, que ao invés de WebScraping, a fonte dos dados fossem planilhas vindas do Departamento de Vendas, que você precisaria limpar e inserir em um banco de maneira padronizada diariamente…Entendeu?! Espero poder ter te ajudado, e também, te convido a me seguir, que toda semana eu trago conteúdo novinho em folha. Ah, te convido a participar dessas aulas semanais que acontecem no meu canal do Youtube.Acesse CLICANDO AQUI Forte abraço

Airbnb no Chile é Caro?

Airbnb no Chile é Caro?

Vamos hoje falar de uma análise exploratória que fiz sobre usar uma locação de imóvel para estadia no CHILE com Airbnb. Para quem não sabe, o Airbnb é uma plataforma de locação de imóveis por tempos curtos, diretamente com o proprietário, como alternativa ao convencional aluguel de quarto de hotel. A plataforma está presente em quase todos os países, emprega mais de 5 mil pessoas, e em 2020 sua receita havia ultrapassado os US$ 3.378 bilhões. O LOCAL ANALISADO O CHILE é um país que margeia a costa do pacífico na América do Sul, e tem sido um destino comum dos Brasileiros que desejam viajar para fora do país. Seu litoral tem extensão de mais de 6 mil Km e se estende até perto da Antártida, aonde reclama soberania sob 1.250 mil Km². Um dos destinos mais procurados por turistas são as estações de esqui La Parva, que é uma cidade e estação de esqui localizada a cerca de 50 km a nordeste da capital chilena de Santiago. Fica no cume do meio dos resorts “3 Vales”, que também inclui El Colorado e Valle Nevado. Ainda no norte do país, outros destinos muito admirados e visitados são os Lagos Atiplano, Vale da Lua, Lago Chungará, Vulcões Parinacota e Pomerape (mais de 6 Km de altura), e claro, outras estações de esqui, como as famosas Valle Nevado e Portillo. Ao sul podemos citar a Patagônia Chilena, Parque San Rafael (geleiras), Arquipélago de Chiloé e Ilha de Páscoa. A análise dos dados sobre Airbnb no Chile Usamos para esse estudo uma base de dados REDUZIDA do CHILE cedidas pela Airbnb, a qual está datada de agosto/2020. Essa base nos traz pouco mais de 9 mil registros de imóveis para locação temporária no país, bem como 17 categorias de informações sobre cada registro. O estudo é uma analise de dados pura, ou seja, captura > tratamento > carregamento > interpretação de dados.  Nesta oportunidade não foram aplicadas técnicas de aprendizado de máquina (inteligência artificial). Como o estudo foi elaborado? Limpamos os dados, retirando os “pontos fora da curva”, e ordenamos os dados para facilitar a leitura, e por sua vez o entendimento. Esses pontos fora da curva, denominados outliers, são imóveis com quantidade de pernoites maior que 21 dias, e com valores zerados ou maiores que 95% dos registros. Com essa limpeza nossa base reduziu em 800 linhas, representando 8% de nossos dados. Conclusão O estudo aponta que em AGO/2020, haviam muitas opções para “se hospedar” no Chile na faixa dos 200 a 300 Reais, que é uma faixa de valores interessante para o turista brasileiro.  O local mais caro que pudemos identificar, foi a cumuna (bairro) de Lo Barnechea na cidade de Santiago, com custo mediano de mais de R$ 1.2 mil por noite.  Compartilhando o código fonte O algoritmo desenvolvido em Python está disponível no Github, o qual recomendamos que você faça o Download, pois algumas funcionalidades (como folium) não funcionam bem no GITBUB. Forte Abraço

MUITO + que Power Query

Aprenda também SQL, DAX, Python e outras ferramentas que vão te fazer assumir posição de destaque em sua empresa.

Solicite a EMENTA CURRICULAR da FORMAÇÃO