expurgado dos resultados das distribuidoras de energia nos cálculos da agência reguladora, e os fenômenos climáticos, ou meteorológicos que por ventura derrubem o sistema, como descargas elétricas, ventanias, entre outros fatores. Segundo Silva (2013), em nosso país, aproximadamente 70% dos desligamentos na transmissão e 40% na distribuição, são provocados por raios, sendo o número de transformadores queimados por descargas elétricas atmosféricas em torno de 40%. Tais números causam um impacto considerável no fornecimento de energia, o que pode ser constatado pela alta correlação entre a incidência de descargas elétricas e os índices de qualidade da maioria das empresas do setor elétrico. No trabalho de Wronscki et al (2003), após a utilização de modelos estatísticos, foram encontradas evidências de maior número de atendimentos e maior tempo médio de atendimento nas chamadas emergenciais de interrupção no fornecimento para a condições meteorológicas de vento e chuva, enquanto houve um menor número para a condição temperatura. A distribuidora de energia do Maranhão, que durante anos permaneceu entre as três melhores empresas do país no quesito qualidade no fornecimento de energia, despencou em 2021 para os últimos lugares, de acordo com o último ranking divulgado pela [ANEEL] (2022). A empresa acredita que isto não se deve aos investimentos realizados na rede, que na verdade, ano após ano são cada vez maiores, mas se deve a um ano atípico de muitos registros de fortes precipitações, enchentes, ventanias, descargas elétricas atmosféricas, entre outros fenômenos climáticos. Este trabalho tem como objetivo verificar e quantificar a correlação entre os fenômenos meteorológicos e a quantidade de ocorrências de interrupção no fornecimento de energia elétrica registradas pelo centro de operações integradas da distribuidora energética do Estado do Maranhão, para os municípios de São Luís e Imperatriz. # II. Material e Métodos O princípio que irá nortear este trabalho de pesquisa, a formar a base de dados final para estudos, ou seja, após a fase de "data wrangling", é que esta base de dados reflita muito bem o fenômeno a ser estudado, que é a interrupção no fornecimento de energia, que seja capaz de explicar o preceito principal de que, apesar das dificuldades enfrentadas particularmente no país, em suma, o fornecimento de energia elétrica passa mais tempo em continuidade do fornecimento, do que interrompido, ou suspenso. Para se ter uma dimensão sobre tal fato, o indicador do [DEC] em 2021, valor apurado na média para todo o Brasil, segundo o Governo Federal (2022), ficou em 11,84 horas. Em outras palavras, de um total de 8.760 horas do ano de 2021, em 99,86% do tempo a energia esteve em pleno fornecimento, sem interrupção, no Brasil inteiro, como pode ser constatado na Figura 1. # Fonte: Governo Federal (2022) Figura 1: Recorte do Resultado do [DEC] em 2021 Ainda que o resultado para o Maranhão tenha ficado acima deste valor, registrando 29 horas, estando 99,67% do tempo em pleno fornecimento, conforme informado pelo distribuidora de energia em seu site de relacionamento com os investidores, em março de 2022, este número continua apontando para um fato supra relevante: a base de dados deve dar alicerce para realizar o estudo de um fenômeno raro, ou seja, que além dos dados sobre as interrupções no fornecimento de energia, a base deve possuir cada hora em que o fenômeno não aconteceu, o período em que o fornecimento de energia não foi interrompido. Seguindo estra premissa, este trabalho de pesquisa experimental, vem trabalhar a hipótese da existência de uma correlação entre os fenômenos meteorológicos, e a quantidade de vezes em que o sistema elétrico teve sua distribuição interrompida, porém somente dos dados sinalizados como causa desconhecida, atendida por transformadores de distribuição, em dois municípios do Estado do Maranhão. O centro de operações integradas[COI], setor responsável por manter o sistema de distribuição de energia elétrica em pleno atendimento para a população maranhense, possui em seus controles, uma base de registros de interrupções do fornecimento de energia, e seus equipamentos afetados, chamados de componentes, com informações que caracterizam em detalhe a sua tipificação, informações a princípio muito relevantes para esta pesquisa para verificarmos se há um padrão de componentes mais suscetíveis, ou não, às intemperes climáticas. Com autorização da empresa, foram colhidos dados dos últimos doze meses, compreendidos entre agosto de 2021 e julho de 2022, somente dos equipamentos de transformadores de distribuição, já que toda interrupção de energia, que afete o bem-estar dos consumidores, acaba passando por este tipo de equipamento, segundo o especialista do próprio setor. Outro fato importante é que, com a ajuda deste especialista, foram excluídas desta amostra de dados, todas as interrupções de energia derivadas da intervenção humana, como acidentes de trânsito, desligamentos programados, sobrecargas do equipamento causadas pelo consumo, não realização de poda de árvores abaixo da rede elétrica, para citar alguns, o que deixa a base de informações mais limpa para a realização deste estudo, já que todas as interrupções citadas têm a sua causa conhecida, e registrada no sistema. Coletada a primeira parte dos dados, a segunda parte foi fornecida junto com a área conhecida como geoprocessamento, e lá foram coletadas as informações a respeito do clima, para as mesmas cidades. A companhia de energia possui um contrato de prestação de serviços com a empresa Climatempo, e através do Sistema de Monitoramento e Alertas do Climatempo, com a autorização da distribuidora, foram coletadas também informações do mesmo período da base coletada anteriormente, referentes a pluviometria, descargas elétricas atmosféricas, rajadas de vento, velocidade média do vento ao longo do dia, temperatura média, máxima e mínima. As variáveis possuem precisões diferentes para relatar o período em que aconteceram, variando entre a precisão da hora, minuto e segundo em que ocorreram, como os dados de interrupções de energia, e os dados das descargas elétricas atmosféricas, e até informação que trata de resultado válido pelo dia inteiro, como velocidade do vento, e as informações sobre temperatura. Todas foram colocadas na mesma escala de tempo, demonstrando os fatos ocorridos a cada uma hora do dia, durante 365 dias. Assim, foram criadas quatro variáveis para identificar o tempo: ano, mês, dia e hora. Um fato importante é que tal base neste momento contém apenas informações relativas às interrupções, e como estava o clima naquele exato momento, entretanto, como já mencionado, ainda que uma distribuidora no território nacional tenha os piores indicadores de continuidade no fornecimento de energia, mesmo assim o sistema elétrico desta distribuidora hipotética estaria em pleno funcionamentona esmagadora parte do tempo. Desta forma, foram reproduzidos os dados que representam o período em que a energia estava emplenadistribuição, para cada tipo diferente de transformador de distribuição, trazido na amostra de interrupções, com o mesmo período de tempo da amostra, em dias e horas, e devidamente cruzada com a base climatológica, para se conhecer as exatas condições do tempo neste mesmo exato período. Para diferenciar as duas informações na base de dados, foi criada uma variável chamada de "interrupções", do tipo numérica, atribuindo a quantidade "1" para as observações relativas a uma interrupção no fornecimento de energia, e "0" para as observações que representam o período em que a energia estava em pleno funcionamento. Cabe salientar que foram excluídas desta base de dados de observações em que a energia estava em plena distribuição, as observações que coincidem temporalmente com a base de interrupções, afinal, exatamente neste exato período, a energia fortuitamente estava suspensa em seu fornecimento. Também, no intuito de explorar uma outra possibilidade que pode ser relevante para a pesquisa, foi criada uma variável chamada "raio", do tipo binária, para indicar a presença de raios naquela exata hora relada atribuindo o valor 1, e 0 quando o fato não havia ocorrido, o que é diferente da variável "descargas_atm", que apresenta a quantidade de descargas elétricas atmosféricas dentro daquela mesma observação. Finalmente com as duas bases de dados unidas (com e sem interrupções), encerrando a etapa de"data wrangling" da coleta de dados, para que se garanta a aleatoriedade da informação, quanto ao objeto desta pesquisa experimental, e permitindo analisar se este estudo se trata de um caso em que o melhor modelo estatístico deva levar em conta o estudo de um fenômeno raro, considerando o fato de que energia elétrica passa mais tempo em plena distribuição, do que suspensa. Por fim, em razão do tamanho da base de dados para este estudo, se fossem considerados todos os municípios do Estado do Maranhão, ainda que utilizando dados relativos ao período de apenas um ano, foram escolhidos apenas dois dos principais municípios do Estado: São Luís, e Imperatriz. O estudo poderia se limitar a capital do Estado (São Luís), por seu tamanho e importância. Todavia, a cidade de Imperatriz possui características completamente diferentes, no que se diz respeito ao clima, relevo, economia, ou outras não citadas, o que torna ainda mais interessante checar neste estudo, se há semelhanças nos resultados obtidos entre os dois municípios, o que poderia levantar outras hipóteses, para outros trabalhos futuros. # III. Modelo de Regressão de Poisson A metodologia estatística que foiadotada neste estudo foia aplicação do modelo de regressão de Poisson. Os modelos de regressão Poisson e o modelo de regressão binomial negativo fazem parte do que éconhecido por modelos de regressão para dados de contagem, que têm porobjetivo analisar o comportamento, em função de variáveis preditoras, de umadeterminada variável dependente que se apresenta na forma quantitativa, comvalores discretos e não negativos, exatamente como o objeto de estudo deste trabalho, onde a princípio não é possível fracionar o evento "interrupção do sistema elétrico" (não considerase neste estudo os casos em que a energia esteve em oscilação quanto ao fornecimento), tendo sempre sua quantificação como números discretos e positivos. Considerando o que afirma Fávero e Belfiore (2022, p.149), ao mencionar que no caso de ocorrência de fenômenos raros, com baixa probabilidade de sucesso (p ? 0), sob determinada exposição (unidade temporal, espacial, social, etc.)., como no caso desta pesquisa experimental, em determinado intervalo de tempo, o modelo de distribuição Poisson se torna o prioritário a ser explorado. # Expressão do modelo de Poisson: ln?? i ? = ln?? poisson i ? = ? + ? 1 . X 1i + ? 2 . X 2i + . . . + ? k . X ki form. (1) Em que ln?? i ? ou ln?? poisson i ? é definido a partir de uma função de ligação canônica que é proposta com base na definição dos logaritmos das funções de verossimilhança oriunda da função densidade/ probabilidade da distribuição Poisson, ?representa os termos do intercepto, ? k são os coeficientes de cada variável explicativa e correspondem aos parâmetros a serem estimados, eX ki são as variáveis explicativas. Fórmula da probabilidade da distribuição Poisson: p(Y i = m) = e -? i .? i m m! form. (2) Em que p(Y i = m) é afunção da probabilidade de um evento, no modelo de regressão de Poisson, determinada por uma observação i (i = 1, 2, ..., n), "n" é o tamanho da amostra, e possui a probabilidade de ocorrência de uma contagem "m", em uma determinada exposição (período, área, região, entre outros exemplos), em que "?" é o número esperado de ocorrências ou a taxa média estimada de incidência do fenômeno em estudo para uma dada exposição A título de comparação de melhor modelo, também foi aplicado neste estudo o modelo de regressão binomial negativo, também conhecido como Poisson Gama, outro modelo de contagem aqui citado. A diferença básica entre os dois modelos,é que o modelo binomial negativo é mais utilizado para os casos de superdispersão, ou inflação de zeros da amostra, onde a variância da variável dependente é maior que sua própria média. Segundo Fávero e Belfiore (2022, p.696), a superdispersão é comumente gerada pela presença de maior heterogeneidade nos dados entre observações da amostra. # Expressão do modelo Binomial Negativo: ln?? i ? = ln?? bneg i ? = ? + ? 1 . X 1i + ? 2 . X 2i + . . . + ? k . X ki form. (3) Em que ln?? i ? ou ln?? bneg i ? é definido a partir de uma função de ligação canônica que é proposta com base na definição dos logaritmos das funções de verossimilhança oriunda da função densidade/ probabilidade da distribuição Poisson Gama, ou Binomial Negativa, ?representa os termos do intercepto, ? k são os coeficientes de cada variável explicativa e correspondem aos parâmetros a serem estimados, e X ki são as variáveis explicativas. Fórmula da probabilidade da distribuição Binomial Negativa: p(Y i = m) = ? ? .m i ? -1 .e -m i .? (?-1)! form. (4) Em que p(Y i = m) é a função de probabilidade no modelo binomial negativo determinada por uma observação i (i = 1, 2, ..., n), "n" é o tamanho da amostra, onde ? é chamado de parâmetro de forma e deve ser maior que zero, e ? é chamado de parâmetro de taxa de decaimento, também maior que zero. A hipótese nula para este estudo será a baixa ou nenhuma correlação entre os fenômenos meteorológicos e as interrupções no fornecimento de energia elétrica em uma distribuidora, abrindo a possibilidade de estudar outros fatores, como a fadiga dos equipamentos, vida útil da rede de distribuição, ou mais fatores, que possam ter preponderância maior na suspensão ocasional da distribuição energética de eletricidade. Ainda, foram feitas análises de correspondências múltiplas, que se trata de uma técnica multivariada que possibilita a investigação de associação com mais de duas variáveis categóricas, conformeFávero e Belfiore (2022, p.463), no intuito de perceber a relação de interdependência entre as variáveis utilizadas neste estudo, trabalhando somente com as observaçõesonde ocorreram as interrupções do fornecimento de energia elétrica, nas duas amostras os dados. As técnicas de análise de correspondência são métodos de representação de linhas e colunas de tabelas cruzadas de dados, como coordenadas em um gráfico, chamado de mapa perceptual, a partirdo qual se podem interpretar as similaridades e diferenças de comportamento entre variáveis, e entre categorias. Essa técnica tem como principal objetivo avaliar a significância dessas similaridades, reduzindo suas dimensões, de modo a determinar coordenadasdas categorias com base na distribuição dos dados em tabelas cruzadaspara,a partir dessas coordenadas, construirmapas perceptuais, que nada mais são que diagramas de dispersão que representam as categorias das variáveisna forma de pontos em relação a eixos de coordenadas ortogonais, fazendo delas,na realidade, mapas de categorias. O método para realizar a análise consiste em transformar as variáveis qualitativas em variáveis binárias, obtendo daí uma matriz binária. Com base nesta matriz binária, é obtido a inércia principal total na [ACM]. Supondo que a matriz binária seja semelhante a uma tabela de contingência da análise de correspondência, é possível obter a inércia principal parcial das dimensões, seus autovalores, autovetores, e posterior coordenadas desta matriz. Outro método alternativo é a combinação em uma única matriz, as tabelas de contingências com os cruzamentos de todos os pares de variáveis. Essa matriz resultante, quadrada e simétrica, é conhecida por matriz de Burt, como explica Baltar (2005). Só participaram da [ACM] as variáveis que apresentaram associação estaticamente significativa, com pelo menos uma variável contida na análise, por meio do teste do X 2 . Caso alguma delas não apresentasse associação com outras, estas ficaram excluídas da análise de correspondência. Ao elaborar o mapa perceptual, são representadas no mapa as coordenadas dasdimensões que apresentam a inércia principal parcial maior do que a média dainércia principal total por dimensão. A aplicação dos modelos estatísticos se deu através da linguagem R, utilizando o software RStudio versão 1.4.1106. A base final foi exportada para o formato de planilha, e tratada em banco de dados SQL Server. # IV. Resultados e Discussão a) São Luís Foram carregados os dados da amostra de São Luís, coletada na distribuidora de energia no R com um total de 272.151 observações e 12 variáveis. Os dados podem ser vistos através da função "glimpse()", conforme apêndice. Para reforçar essa possibilidade conceitual, de que o objeto de estudo deste trabalho de pesquisa, se trata de um fenômeno raro, foi realizado o diagnóstico preliminar para observação de eventual igualdade entre a média e a variância da variável dependente INTERRUPCAO, cujos resultados foram respectivamente 0,0180268 e 0,0177019, valores muito próximos, o que indica fortemente que de fato, o modelo estatístico mais indicado para explicar a contagem de interrupções de energia elétrica da amostra de dados de São Luís, seja um modelo de regressão Poisson. Utilizando a função "glm()", fez-se a estimação deste modelo, colocando a variável INTERRUPCAO como a variável dependente, e as outras onze variáveis, já citadas, como variáveis explicativas. O primeiro resultado apurado com base no modelo de regressão de Poisson, confirma a hipótese desta pesquisa experimental, de que existe de fato uma correlação entre os fenômenos meteorológicos e as vezes em que o fornecimento de energia elétrica foi interrompido aos consumidores de São Luís, pois pelo menos um beta de uma variável com informações da meteorologia no momento em que acontece a interrupção, teve o seu p-valormenor que 0.05, ou seja, podemos admitir o modelo estatísticos perfeitamente correlacionado, para fins preditivos, como vê-se na Tabela 1, através da função "summary()". Para fins de comparação, e se aproximar da certeza de que o modelo estatístico não se trata de uma distribuição Binomial Negativa, corroborando com o diagnóstico preliminar que compara a média e a variância da base coletada de dados de São Luís, fezse necessário carregar o modelo binomial negativo desta mesma base, utilizando a função "glm.nb()". Segundo Bussab e Morettin (2005), o princípio da verossimilhança explica que se deve escolher aquele valor do parâmetro desconhecido que maximiza a probabilidade de obter a amostra particular observada, ou seja, o valor que torna aquela amostra a "mais provável". Esse princípio foi enunciado por Ronald Aylmer Fisher pela primeira vez em 1912 e, em 1922, deu-lhe forma mais completa, introduzindo a expressão Log-Likelihood(verossimilhança). Em outras palavras, o método de máxima verossimilhança consiste em estimar o parâmetro ? por uma amostra aleatória X1, ..., Xn independente e igualmente distribuída de X. Na Figura 2 é feita a comparação entre os dois modelos estatísticos, comparando o Log-Likelihoodde ambos os modelos estatísticos aplicados na amostra de São Luís. # Correlations between Meteorological Phenomena and Interruptions in the Supply of Electric Energy in a Power Supplier Apenas para exemplificar a importância desta pesquisa experimental, tomando o modelo estatístico fundamentadamente adotado, através da função "predict", é possível estimar em aproximadamente 36,6%, a probabilidade de ocorrer uma interrupção do fornecimento de energia elétrica de um transformador de distribuição com três fases conectadas (ABC), de carga de 112,5Kva, sob uma chuva de 15 milímetros, com uma temperatura mínima de 22ºC, na presença de raios, rajadas de vento de 30Km/h,conforme pode ser visto no apêndice deste trabalho. # Global Journal of Research in Engineering ( F ) XXIII Issue IV Version Ainda, cabe neste trabalho explorar a relação que cada uma destas variáveis que explicam as interrupções no fornecimento de energia, na amostra utilizada no modelo de Poisson, se relaciona-se entre si. Para isto, foi gerada um segundo "dataframe", a partir da base denominada de final. Em um novo "wrangling" dos dados, para que se possa realizar uma análise de correspondência, foram criadas novas variáveis para minimizar a quantidade de rótulos a serem exibidos num mapa perceptual que será feito com a análise de correspondência múltipla [ACM]. A variável PLUVIOMETRIA, foi substituída pela variável PLUV_TIPO, agora como uma variável categórica, contendo uma classificação da chuva baseada na sua intensidade medida na quantidade de milímetros registrados naquela hora. A classificação da intensidade da chuva obedeceu aos critérios adotados pela Organização Meteorológica Mundial -OMM (2018), e para nossa amostra, se dividiu entre fraca, moderada e forte. A variável RAJADA foi substituída pela variávelRAJADA_TIPO, e suas categorias foram classificadas segundo a escala Beaufort, também disciplinada pela OMM, escala baseada na velocidade do vento registrada conforme Tabela 2.A variável VENTO foi excluída por possíveis relações de multicolinearidade na amostra com outras variáveis, como já mostradoneste trabalho. A variável RAIO foi mantida, mas para fins de exibição dos rótulos de dados no mapa perceptual da [ACM], os valores "0" e "1", foram substituídas respectivamente pelas categorias "RAIO_NAO" e "RAIO_SIM". A variável DESCARGAS_ATM foi excluída, sem substituta, por não ter sido encontrado quaisquer classificações advindas de instituições oficiais ou norma científica, nas pesquisas deste trabalho, que definissem a intensidade de descargas elétricas atmosféricas. # Correlations between Meteorological Phenomena and Interruptions in the Supply of Electric Energy in a Power Supplier # Global Journal of Research in Engineering ( F ) XXIII Issue IV Version I Year 2023 Tabela De forma semelhante, as três variáveis de temperatura foram substituídas por três novas variáveis categóricas, TEMP_MIN_FAIXA, TEMP_MAX_FAIXA e TEMP_MED_FAIXA, onde de forma arbitrária, por também não ter encontrado literatura semelhante às outras variáveis anteriormente citadas, que agrupam as temperaturas por faixa. Por último, para fins demonstrativos, destinados a orientar estudos posteriores a este trabalho, foram selecionados apenas três transformadores de distribuição na amostra, em razão de serem os mais utilizados pela Companhia, da igual forma, a fase escolhida a foi a "ABC". Através do comando "mca()", obtemos a análise de correspondência múltipla da amostra. Foram obtidas 15 dimensões, e a inércia total explicada se deu conforme exposto no Figura 3. # Fonte: Resultados originais da pesquisa Figura 3: Inércia Total Explicada da [ACM] da Amostra Por fim, para fins de exemplo de estudos que possam ser explorados pelas áreas de engenharia, com outros equipamentos, em outras regiões do Estado, ou mesmo em subestações, linhas de transmissão, tem-se o mapa perceptual da Figura 4. # Correlations between Meteorological Phenomena and Interruptions in the Supply of Electric Energy in a Power Supplier # Global Journal of Research in Engineering ( F ) XXIII Issue IV Version I Year 2023 Fonte: Resultados originais da pesquisa Figura 4: Mapa Perceptual da [ACM] da Amostra Para Exemplo de Estudo Em uma breve análise do mapa, é possível perceber relações importantes entre algumas variáveis, que configuram as situações mais comuns para interrupções no fornecimento de energia elétrica. Vê-se no mapa que os transformadores de distribuição do exemplo da amostra, estão mais vulneráveis a um dia sem descargas elétricas atmosféricas, com rajada de vento calma (velocidade do vento próxima a zero), com uma temperatura média entre 28ºC e 30ºC, e uma chuva fraca (menos de 2,5 mm/h). Mas também interessante notar o quanto uma rajada de vento classificado como Brisa Forte, na Escala de Beaufort, com velocidade do vento acima dos 38Km/h, pode ser mais preponderante a derrubar o sistema elétrico, do que uma chuva moderada. Entretanto, antes de quaisquer conclusões antecipadas, cabe verificar se as mesmas distâncias se mantêm quando vistas em gráficos de três dimensões. que pode se tornar um trabalho de rotina a se adotar em uma distribuidora de energia elétrica. # b) Imperatriz Após a carga dos dados da cidade de Imperatriz, segunda principal cidade do Estado do Maranhão em importância econômica, para efeitos de comparação com os resultados encontrados para a capital do Estado, no início deste trabalho, serão seguidos exatos mesmos procedimentos tomados no estudo anterior. A base de dados correspondente a um ano de informações, sobre todos os transformadores de distribuição instalados, contém 280.442 observações. Do mesmo modo como aconteceu com os dados da primeira amostra, para o estudo com os dados do município de Imperatriz, a média e a variância da variável dependente INTERRUPCAO encontradas foram respectivamente 0.0056233, e 0.0055917, números muito próximos, que mostram que o diagnóstico preliminar para observação de eventual igualdade,também aponta para um estudo de um fenômeno raro, mais uma vez, corroborando a tese da Distribuição de Poisson como melhor modelo estatístico para esta nova amostra. Também, para fins de comparação com o estudo anterior, o mesmo exemplo de "predict" feito para a mostra de São Luís, foi feito para a amostra de Imperatriz, com as mesmas variáveis, e o resultado foi bem diferente entre as duas cidades. Enquanto a probabilidade de uma interrupção no fornecimento de energia elétrica na primeira amostra foi de 36,6%, nas mesmas condições do tempo, e mesmas características de transformadores, o resultado foi uma probabilidade de apenas 5,16% do sistema elétrico ser interrompido pelos mesmos fatores (sete vezes menor). # Global Journal of Research in Engineering ( F ) XXIII Issue IV Version Ao realizar a análise de correspondências múltiplas, mais diferenças são observáveis entre os dois resultados. Em razão das disparidades climáticas entre as duas cidades, mais categorias foram adicionadas para os cálculos, gerando 19dimensões para a análise, três dimensões a mais que na amostra de São Luís, conforme o Figura 5, com a inércia total explicada da análise de correspondência múltipla. De acordo com Lima e Ferreira (2013), separadas por aproximadamente 600km, uma da outra, as duas cidades de fato possuem climas bastante divergentes. São Luís, que fica ao norte do Estado, é uma cidade litorânea, mais sujeita a ventos fortes, e temperaturas mais equilibradas ao longo do ano, do que a cidade de Imperatriz, ao sul, com um tipo de clima misto, ora seco como o cerrado e ao sertão, ora chuvoso como o clima amazônico, por fazer fronteira entre estes dois biomas, além de ventos mais fracos, e temperaturas mais extremas do que na capital. # Fonte: Resultados originais da pesquisa Ao analisar o mapa perceptual da amostra de Imperatriz na Figura 6, é interessante perceber que a chuva violenta (com mais de 50mm/h) tem pouquíssima relação com as interrupções no fornecimento de energia de Imperatriz. Isto pode mostrar o quanto o sistema elétrico na região foi bem preparado pela distribuidora para suportar as fortes intempéries do período chuvoso. Já a chuva moderada (entre 2,5 a 10 mm/h) se mostra muito mais relevante para a interrupção do fornecimento de energia do que em São Luís. A rajada de brisa forte, que em São Luís se mostra importante, em Imperatriz é a rajada de brisa fraca (ventos repentinos de 12 a 19km/h) que se mostra mais preponderante. Tal mapa pode auxiliar as áreas de engenharias a encontrar soluções que mitiguem a quantidade de suspensões do fornecimento de energia elétrica, segundo as condições apresentadas. V. Conclusão É possível afirmar, através deste trabalho de pesquisa realizado com dados reais de uma distribuidora de energia elétrica do Estado do Maranhão, com duas de suas principais cidades, que há de fato, com um nível de significância de 5%, fortes correlações associadas aos fenômenos meteorológicos e as interrupções no fornecimento de energia, com causas desconhecidas, para ambas as amostras, com ressalvas que indicam que o estudo precisa ser de fato específico por região, e que, para fins preditivos, o modelo de distribuição de Poisson se encaixa perfeitamente. # Fonte: Resultados originais da pesquisa Ainda, o estudo possibilita às distribuidoras, que possam trabalhar de modo preventivo, identificando as fragilidades do sistema elétrico quanto ao tema, e explorar ações que possam reduzir a frequência com que acontecem as interrupções, analisando não só transformadores de distribuição, mas equipamento por equipamento, ou até mesmo estruturas mais robustas, como subestações, através modelo de Poisson, e de mapas perceptuais de análise de correspondência múltipla, de modo a melhor o indicador do [FEC]. Por fim, também é possível criar um sistema de alertas que envie para o Centro de Operações Integradas, que tipo de equipamento, onde, e a que probabilidade, este possa ter sua distribuição de energia interrompida, de acordo com a previsão do tempo, combinado ao Sistema de Monitoramento de Alertas do ClimaTempo, com previsões em tempo real, podendo antecipadamente ao fenômeno,deslocar equipes de plantão a lugares estratégicos, para que estas possam tomar ações que reestabeleçam o fornecimento de energiacom mais celeridade. Desta forma, melhorando também o indicador do [DEC]. Por fim, este estudo sugere que outras variáveis sejam acrescentadas para um estudo semelhante, como a vida útil da rede, transformador de distribuição, ou o que queira ser estudado. Também seria interessante acrescentar o fabricante, e lote adquirido, para identificar se uma linha de materiais comprados pela distribuidora não possui mais fragilidade à fenômenos meteorológicos. # Agradecimento A Deus por ter me dado toda a força deste mundo para chegar até aqui, com tantas pedras pelo caminho, incertezas que quase me levaram a desistir, dificuldades financeiras, mas principalmente a difícil arte de revezar o tempo com a família, amigos e trabalho, tarefa das mais complicadas que já passei nos últimos tempos. Só eu e Ele sabíamos o que estávamos construindo. Agradecer em especial aos amigos Evandro Lima Meireles, da Gerência Corporativa de Geoprocessamento, e Eliezer Silva de Oliveira, da Gerência Corporativa de Operações, que com seus esforços na fase de mineração de dados, contribuíram enormemente com este trabalho, além também das pessoas que de alguma forma compreenderam este projeto de vida, e minimamente colaboraram para a conclusão deste trabalho. 62![Figura 2: Comparação de Log Lik Entre os Modelos Poisson (2) e Binomial Negativo (Poisson Gama) De acordo com Fávero e Belfiore (2022), quanto menor for o Log-Likelihood na comparação entre modelos estatísticos, melhor é o ajuste do modelo à distribuição da amostra. Assim, para este estudo, será considerado o modelo Poisson (modelo_poisson2) para explicar a contagem dos dados de interrupção de fornecimento de energia elétrica em São Luís do Maranhão.Apenas para exemplificar a importância desta pesquisa experimental, tomando o modelo estatístico fundamentadamente adotado, através da função "predict", é possível estimar em aproximadamente 36,6%, a probabilidade de ocorrer uma interrupção do fornecimento de energia elétrica de um transformador de distribuição com três fases conectadas (ABC), de carga de 112,5Kva, sob uma chuva de 15 milímetros, com uma temperatura mínima de 22ºC, na presença de raios, rajadas de vento de 30Km/h,conforme pode ser visto no apêndice deste trabalho.Ainda, cabe neste trabalho explorar a relação que cada uma destas variáveis que explicam as interrupções no fornecimento de energia, na amostra utilizada no modelo de Poisson, se relaciona-se entre si. Para isto, foi gerada um segundo "dataframe", a partir da base denominada de final.Em um novo "wrangling" dos dados, para que se possa realizar uma análise de correspondência, foram criadas novas variáveis para minimizar a quantidade de rótulos a serem exibidos num mapa perceptual que será feito com a análise de correspondência múltipla[ACM].A variável PLUVIOMETRIA, foi substituída pela variável PLUV_TIPO, agora como uma variável](image-2.png "I Year 2023 6 ©Figura 2 :") 5![Figura 5: Inércia Total Explicada da [ACM] da Amostra (Imperatriz) -Assim como é minuciosamente explicado pelo site Weathers Park (2022), São Luís e Imperatriz possuem grandes diferenças de temperatura ao longo do ano, tendo Imperatriz como cidade com temperaturas mínimas registradas menores que a capital do Estado, e as temperaturas máximas registradas maiores que São Luís.Ainda de acordo com Weathers Park, há diferenças importantes quanto a velocidade dos ventos. São Luís rotineiramente registra maiores velocidades dos ventos do que na cidade de Imperatriz como descrito no referido portal.De acordo com Lima e Ferreira (2013), separadas por aproximadamente 600km, uma da outra, as duas cidades de fato possuem climas bastante divergentes. São Luís, que fica ao norte do Estado, é uma cidade litorânea, mais sujeita a ventos fortes, e temperaturas mais equilibradas ao longo do ano, do que a cidade de Imperatriz, ao sul, com um tipo de clima misto, ora seco como o cerrado e ao sertão, ora chuvoso como o clima amazônico, por fazer fronteira entre estes dois biomas, além de ventos mais fracos, e temperaturas mais extremas do que na capital.](image-3.png "Fonte: Resultados originais da pesquisaFigura 5 :") 6![Figura 6: Mapa Perceptual da [ACM] da Amostra Para Exemplo de Estudo (Imperatriz)](image-4.png "Figura 6 :") ![](image-5.png "") ![](image-6.png "") ![](image-7.png "") ![](image-8.png "") ![](image-9.png "") ![](image-10.png "") ![](image-11.png "") 1KVA15-3,05100,1446-21,0960<2e-16KVA150-0,48340,0484-9,9800<2e-16KVA1500-7,16961,0024-7,15200,0000KVA1750-6,07100,5833-10,4080<2e-16KVA2000-6,47650,7120-9,0960<2e-16KVA225-2,97940,1396-21,3490<2e-16KVA25-7,15201,0015-7,14100,0000KVA250-7,16901,0024-7,15200,0000KVA2600-7,16961,0024-7,15200,0000KVA30-2,99080,1431-20,9010<2e-16KVA300-3,93130,2119-18,5510<2e-16KVA3000-7,16961,0024-7,15200,0000KVA350-6,47650,7120-9,0960<2e-16KVA3500-7,16901,0024-7,15200,0000KVA45-1,26950,0760-16,7130<2e-16KVA5-5,95030,4556-13,0590<2e-16KVA500-4,68470,3004-15,5930<2e-16KVA612,5-6,47650,7120-9,0960<2e-16KVA725-6,47650,7120-9,0960<2e-16KVA75-0,11760,0463-2,54300,0110MEDIA_CLIENTES-0,00060,0004-1,36500,1722PLUVIOMETRIA0,01540,00256,06800,0000TEMP_MIN-0,07200,0149-4,84200,0000TEMP_MAX-0,02000,0132-1,51300,1303TEMP_MEDIANANANANADESCARGAS_ATM0,00150,00072,08700,0369RAIO0,32360,06335,10900,0000RAJADA0,00420,00104,08300,0000VENTOS_KMH0,00210,00151,44000,1499Fonte: Resultados originais da pesquisaNo intuito de evitar efeitos prováveis demulticolinearidade entre as variáveis meteorológicasque naturalmente tendem a ter resultados próximos, foifeito uma nova estimação do modelo, onde foramconsideradas apenas as variáveis que foramestatisticamente significantes para o objeto desteestudo. Desta forma, foram retiradas as variáveisTEMP_MAX,TEMP_MEDIA,DESCARGAS_ATM,VENTOS_KMH,eatribuindoonomedemodelo_poisson2.VariáveisEstimativaErro padrãoValor de ZPr(>|z|)(Intercepto)0,77620,63531,22200,2218FASESABC-0,32580,4756-0,68500,4934FASESAC-2,00670,5547-3,61700,0003FASESB-4,96440,5544-8,9540<2e-16KVA10-5,80390,4141-14,0140<2e-16KVA1000-5,37790,4167-12,9070<2e-16KVA112,50,03390,04170,81400,4158 GrauDesignaçãom/skm/hEfeitos em terra0Calmo<0,3<1Fumaça sobe na vertical1Aragem0,3 a 1,51 a 5Fumaça indica direção do vento2Brisa leve1,6 a 3,36 a 11As folhas das árvores movem; os moinhos começam a trabalhar3Brisa fraca3,4 a 5,412 a 19 As folhas agitam-se e as bandeiras desfraldam ao vento4Brisa moderada5,5 a 7,920 a 28Poeira e pequenos papéis levantados; movem-se os galhos das árvores5Brisa forte8 a 10,729 a 38 Movimentação de grandes galhos e árvores pequenas6Vento fresco10,8 a 13,8 39 a 49Movem-se os ramos das árvores; dificuldade em manter um guarda-chuva aberto; assobio em fios de postes7Vento forte13,9 a 17,1 50 a 61Movem-se as árvores grandes; dificuldade em andar contra o vento8Ventania17,2 a 20,7 62 a 74Quebram-se galhos de árvores; dificuldade em andar contra o vento; barcos permanecem nos portos9Ventania forte20,8 a 24,4 75 a 88Danos em árvores e pequenas construções; impossível andar contra o vento10Tempestade24,5 a 28,4 89 a 102 Árvores arrancadas; danos estruturais em construções11Tempestade violenta 28,5 a 32,6 103 a 117 Estragos generalizados em construçõesFonte: Resultados originais da pesquisa © 2023 Global Journals Então, como pode ser visto na Tabela 3, também foi aplicado o modelo de Poisson, e já é possível verificar em termos quantitativos, que há menos variáveis de fenômenos meteorológicos se correspondendo com a variável dependente, interrupção no fornecimento de energia, do que na cidade de São Luís, sendo elas as variáveis PLUVIOMETRIA e RAJADA. A primeira se referindo ao volume de chuvas, e a segunda com a força repentina do vento, ambas com p-valor abaixo de 0.05, o que significa são estatisticamente significantes para explicar as interrupções no sistema elétrico, há um nível de significância de 5%.Outra diferença em relação aos dados de São Luís, é que enquanto no estudo da capital, em que dois tipos de fases da amostra (AC, e B) se mostraram estatisticamente significante para fins preditivos, a um intervalo de confiança de 95%, nenhuma fase da amostra de Imperatriz teve resultado semelhante. Entretanto, vale pontuar que a fase ABC possui uma significância de 10%, enquanto na amostra de São Luís, a mesma não teve significância importante para o modelo estatístico de Poisson.Já em relação a potência dos transformadores (variável KVA), resultado muito semelhante se obteve ao estudo da amostra de dados de São Luís. Em Imperatriz, praticamente todos os transformadores de distribuição mostraram p-valor abaixo de 0.05, quanto a sua potência, ficando de fora apenas os transformadores com potência de 45kva, apresentando um p-valor igual a 0.16979. * Análise fatorial múltipla para tabelas de contingência VTBaltar 2005 Tese de Doutorado. Universidade de São Paulo * WOBussab PAMorettin Estatística Básica 2005 Saraiva 5 São Paulo * Cemig é multada por indicadores de qualidade Canalenergia 2022 * Manual de Análise de Dados LPFávero PBelfiore 2022 LTC Rio de Janeiro * Grupo Equatorial Energia Central de Resultados. Disponível em 2022 * Imprensa Nacional [IM]. [ANEEL] divulga desempenho e ranking das distribuidoras sobre fornecimento de energia em 2021 2022 * RM B FLima AJ AFerreira Estudos de Geografia do Maranhão. Maranhão. EDUFMA 2013 * A relação entre raios e chuvas nos arredores de Manaus: análise de casos extremos. Dissertação (Mestrado) -INPA/UEA JCSilva 2013 Manaus, AM * Clima e condições meteorológicas médias em Imperatriz no ano todo ParkWeathers Disponível em * Clima-caracter%C3%ADstico-em-Imperatriz-Bra sil-durante-o-ano> Acesso em 15 de out 2022 * Clima e condições meteorológicas médias em São Luís no ano todo ParkWeathers Disponível em * Clima-caracter%C3%ADstico-em-S%C3%A3o-Lu %C3%ADs-Brasil-durante-o-ano> Acesso em 15 de out 2022 * Guide to Instruments and Methods of Observation: Volume I -Measurement of Meteorological Variables Genebra, Suíça: Organização Meteorológica Mundial 8 World Meteorological Organization 7 ed. 2018. 618p. Disponível em. Acesso em 04 de out. de 2022 * Apêndice: Operações utilizadas no R Studio para a realização deste estudo VRWronscki Seminário Brasileiro sobre Qualidade da Energia Elétrica Aracaju, SE 2003