linux-BR.org

Notícias de software livre e tecnologias

Em alguns casos, os dados de desempenho do banco do banco possuem várias entradas para a mesma tupla (data, nome do banco, nome da variável).A análise de dados é inerentemente um processo interativo; portanto, a capacidade de alterar rapidamente nosso script, ver os resultados atualizados e continuar fazendo edições é crucial para a velocidade.Por exemplo, poderíamos ter usado a função max () para agregar o valor mais alto de Ts. em cada combinação única de data, variável_name e nome.Ele nos permite autenticar no banco de dados do Snowflake, executar a consulta SQL e retornar os dados como um quadro de dados de pandas.Ele alterna automaticamente entre a gravação do código SQL ao importar dados de um banco de dados e a gravação do código Python ao transformar dados.

Fonte: https://blog.trymito.io/choosing-between-sql-and-python-best-practices-for-data-analytics-workflows/