Joviano

Tag: Python

Identificando fraudes em transações com Python

Identificando fraudes em transações com Python

Uma das principais preocupações das instituições financeiras, como bancos e fintechs, é detectar fraudes em transações com cartões de crédito. Apenas no Brasil, cerca de 12,1 milhões de pessoas já foram vítimas de algum tipo de fraude financeira no último ano. Traduzindo em valores, os golpes financeiros ultrapassaram a cifra de R$ 1,8 bilhão de prejuízo por ano para os últimos 12 meses. Dentre essas fraudes, aquelas envolvendo cartões de crédito são de grande relevância uma vez que a sua não-detecção acarretará em prejuízos consideráveis, tanto para o consumidor quanto para a instituição financeira. Um fator problema quando da elaboração de um algoritmo nesse tema, é a classificação errônea (pelo algoritmo) de possível fraude, ou seja, aquelas vezes em que você tentou fazer uma compra e teve seu cartão bloqueado preventivamente – o que provavelmente gerou estresse e constrangimento. Por todos esses motivos, o investimento na área de detecção de fraudes por meio de Inteligência Artificial vem crescendo a cada ano, representando uma grande oportunidade em Data Science.  Dispondo de grandes volumes de dados como base histórica, um algoritmo de Machine Learning apenas um pouco melhor que os anteriores já representa uma economia de milhões de Reais. E esse é o desafio, aprimorar cada vez mais o uso de algoritmos visando inibir ou evitar transações fraudulentas. SOBRE O ALGORITMO Elaboramos um algoritmo robusto, mas compreensível para os iniciantes, aonde é possível que você colha insights, e aplique em seus problemas reais. Usamos bibliotecas famosas como Pandas, Numpy, Scikit-learn entre outras, tomando o cuidado de lhe apontar qual versão usamos, para que você replique exatamente como fizemos. A base de dados estava bem tratada, sem dados ausentes, e com uma técnica de redução de dimensionalidade (PCA), o que torna o trabalho desafiador, e cheio de oportunidades. Outro fator importante a mencionar, é que menos de 1% dos dados são fraudes, e precisamos balancear os dados para garantir o melhor treino do modelo de Machine Learning. Falando em modelo, usamos uma Regressão Logística, a qual teve performance superior aos 90% de acerto em ambas métricas  COMPARTILHANDO O CÓDIGO FONTE O algoritmo desenvolvido em Python está disponível no Github, o qual recomendamos que você faça o Download, e replique em seu ambiente. Ah, se você gostou, considere compartilhar esse artigo em suas redes sociais. Forte Abraço!

Traduzir tabelas com frases em qualquer idioma

Traduzir tabelas com frases em qualquer idioma

Senhores, quem de vocês já não precisou traduzir tabelas de seu conjunto de dados, e queria fazer isso de forma automática? Pois bem, as vezes queremos fazer isso nos títulos das inúmeras colunas de nosso dataset, as vezes dentro das séries ou das listas. Eu comecei meus testes com o translate do python, mas, ele tem um limite pequeno de requests para o ‘plano free’. Pensei que teria que fazer um Scraping com BeautifulSoup, mas não, consegui encontrar e montar pra turma uma solução bem interessante. A solução está disposta no meu GUTHUB (pra quem quiser copiar) O algoritmo consiste na utilização da biblioteca googletrans , e tudo funcionou bem…será?! não…tive que fazer uns ajustes. Explico no inicio do projeto, como funciona a biblioteca (fácil demais), e ao simular em uma lista, percebi que algumas vezes ela não traduzia, ou se fazia, o response era o próprio texto na língua original. Então, criei um loop, a estilo “burro do Shreck”, que se percebeu que o texto não traduziu, ele espera alguns segundos, e tenta denovo…até conseguir. Minha dica aqui é que você aumente esse Sleep, pois 10 segundos ali, é para fins didáticos.  A explicação pode ser que, o GOOGLE tem um API de tradutor, o qual você paga por strings, logo, pra usar algo de graça, tem que ter alguma limitação mesmo. A solução que eu montei foi para contornar, de forma paleativa, esse problema. No final do código mostro como aplicar esse conceito através de APPLY + LAMBDA na coluna do DATAFRAME PANDAS. Espero que gostem, e que esse código possa vir a te ajudar, e, abrir a mente para outras possibilidades. Forte abraço,

A ementa possui centenas de aulas, e resumimos em um painel de PowerBI o qual enviaremos a você.

Preencha seu nome e email que em instantes receberá a ementa completa deste pacote de cursos.

Formato Aceito: [+ código do pais] [código de área] [número]