Weblog sobre Otimização de processos usando técnicas de inteligência artificial, análise estatística e modelagem matemática.
[gm]² - Sustentabilidade Corporativa
Insumos Técnicos para tomada de decisão em diversos segmentos de negócio, promovendo Sustentabilidade Corporativa.
Geração Sustentável de Energia Elétrica
A Energia Elétrica é uma das principais formas de energia que o homem mais depende e utiliza na atualidade, graças a sua facilidade de transporte e baixo índice de perda energética durante conversões. Tem como base na geração de diferença de potencial elétrico entre dois pontos, que permitem estabelecer uma corrente elétrica entre ambos.
A geração de energia elétrica é uma atividade humana básica que está diretamente relacionada com os requerimentos primários do homem. Todas as formas de utilização das fontes de energia, tanto as convencionais como as alternativas, agridem em maior ou menor medida o nosso meio ambiente.
Quando falamos em Sustentabilidade Corporativa, uma maneira de aplicá-la à geração de energia pode se dar através da estimação do uso de recursos energéticos, afim de evitar desperdícios e produzir apenas o que for suficiente e que não cause problemas, como apagões em cidades. No post anterior, tecnicamente o material trata de extrapolação de funções já bem conhecidas do mundo real. Basicamente o que precisa ser feito para tornar uma estimação de caso prático mais eficiente são:
- Dados qualitativos e históricos sobre o problema;
- Elaboração de um modelo para estimação
- Treinamento do modelo;
- Aplicação do modelo em testes para em seguida jogá-los para pontos futuros.
Algumas empresas já aplicam isso internamente em seus dados através do uso de Business Intelligence, Data Mining e Análise Estatística. Como isso se daria para uma geração eficiente de energia elétrica?
A geração de eletricidade é o primeiro processo na entrega da eletricidade aos consumidores. Outros três processos são:
- Transmissão de energia elétrica
- Distribuição da eletricidade
- Venda da eletricidade .
A solução para transportar energia a baixo custo veio através da geração de energia de forma descentralizada através de corrente alternada trafegando a grandes distâncias. Logo, faz-se importante observar o quanto é produzido para evitar desperdício de recursos. A maneira de fazer isso é observar a relação entre o histórico de produção de energia e o consumo da mesma. É notório que essa relação tende a ser eficiente quando ela se reduz a um valor mínimo possível dentro de um desvio percentual associado.
Nesse momento, um modelo de previsão de demanda de energia faz-se necessário quando se quer deixar de gastar recursos naturais e injetar o capital poupado na promoção dos próprios recursos naturais ou até mesmo em outras formas de sustentabilidade, como no caso de treinamento de recursos humanos de uma companhia de energia, por exemplo.
Falando um pouco mais tecnicamente, podemos esboçar no grafico abaixo um exemplo de como se comporta uma função de consumo de energia ao longo do tempo:

Dessa forma, nota-se uma sazonalidade dos recursos consumidos com uma série de inconstâncias em pontos locais, fazendo com que o recurso de energia produzido, em caso de não se passar por um processo de estimativa, sofra uma geração de recursos energéticos abaixo de uma linha de eficiência (em alguns casos, porque a estimação foi falha e houve falta de dados históricos ou dados de baixa qualidade).
Energia Renovável
Um ponto importante na geração de energia é dar espaço para fontes não-poluentes e abundantes e controlar o uso de fontes poluentes e esgotáveis. A utilização de estimativas de consumo são utéis e favorecem ambos os casos, pois controlando de forma sistemática a produção de energia, libera-se espaço e recursos financeiros em ferramental tecnológico para geraçao alternativa de energia (por sua vez é custosa de ser implantada) havendo retorno sobre o investimento de maneira tardia.
Por isso, quando se tem um modelo que consegue estimar o quanto precisa produzir, há uma vantagem dele conseguir ganhos, diminuindo dessa forma o valor gasto necessário para produzir energia com os recursos disponíveis.
Os insumos técnicos já existem na literatura científica e podem ser aplicáveis de forma ágil como plano piloto sob qualquer histórico de dados relativos a consumo e geração de energia em companhias elétricas. Desse modo, promove-se sustentabilidade de forma responsável, dando margem para injeção do retorno financeiro em fontes alternativas de energia.
Enfim, é possível ter ganhos financeiros sem desperdiçar recursos ambientais.
________________
Glaucio G. de M. Melo
[gm]² Business Analyst
Resultados em Previsão de Séries Temporais
Na tentativa de mostrar a eficiência do modelo proposto pela [gm]² foram adquiridas um conjunto de séries temporais relevantes do mundo real provenientes de diferentes naturezas.
As séries temporais estudadas a seguir são divididas em três conjuntos: conjunto de treinamento (50% dos dados), conjunto de validação (25% dos dados) e conjunto de teste (25% dos dados). O conjunto de treinamento e validação são usados para ajustar os parâmetros do modelo proposto, enquanto que o conjunto de teste é utilizado para medir o desempenho do modelo e o risco associado a tomada de decisão baseado no modelo.
Inicialmente, nos preocupamos com séries temporais de fenômenos naturais (tempo, brilho de estrela, manchas solares, etc) . Estas séries são provenientes de observações de um determinado fenômeno natural. Assim, com a estimativa/previsão de tais fenômenos, é possível nos precavermos de situações de perigo extremo, como furações, tornados, tempestades, etc, bem como a previsão do tempo, que é necessária para o período de colheita e cultivo. Desta forma, a seguir apresentamos duas séries temporais que são consideradas relevantes, sendo extensamente utilizadas como benchmark de sistemas de previsão.
A primeira série é a chamada série STAR, que é uma série temporal natural com observações diárias da intensidade luminosa de uma estrela de brilho oscilante, realizadas sempre no mesmo local e hora, sendo constituída por 600 pontos.
O modelo proposto obteve, no conjunto de teste, um acerto de 97% em relação a direção da série temporal (ou seja, se o valor no tempo t+1 sobre ou desce em relação ao valor no tempo t), associado a um erro percentual de 2%. A Figura a seguir apresenta o gráfico da previsão gerada pelo modelo proposto.
A segunda série é a chamada série SUNSPOT. Em 1610, logo após observar o sol com o seu telescópio, Galileo Galilei realizou a primeira observação européia de manchas solares. As manchas solares são regiões escuras na superfície do sol. As manchas solares são regiões na superfície do sol com campos magnéticos de magnitude milhares de vezes maior do que o campo magnético da Terra, geralmente apresentando-se em grupos. De forma sistemática, as observações diárias das manchas solares foram inicializadas no século XVIII, mais precisamente em 1746, sendo o número de manchas utilizado para a construção da série calculado pela contagem do número de grupos e o número de manchas individuais, sendo constituída por 289 pontos. Esta série é bastante complexa e muito difícil de se prever.
O modelo proposto obteve, no conjunto de teste, um acerto de 90% em relação a direção da série temporal (ou seja, se o valor no tempo t+1 sobre ou desce em relação ao valor no tempo t), associado a um erro percentual de 5%. A Figura a seguir apresenta o gráfico da previsão gerada pelo modelo proposto.
O segundo tipo de séries que nos preocupamos foram com as séries financeiras, ou seja, séries temporais provenientes do mercado de ações (Índices de bolsas de valores, preços de ações, etc).
Assim, com a estimativa/previsão de tais séries, é possível fornecer ao investidor retorno financeiro associado a um risco bem inferior. Antes de apresentar os resultados obtidos, é válido mencionar um dilema que surge a partir destas séries financeiras. Vários economistas e investidores comentam que tais series seguem um modelo do tipo random-walk (ou seja, são séries aleatórias) e não podem ser previstas. Na literatura de séries temporais financeiras, também tem se notado que nenhum modelo é capaz de prever tais séries com precisão desejável (com risco inferior a 5% e um acerto na direção da série acima de 50%). Em outras palavras, os modelos conhecidos na literatura não conseguem prever tais séries, onde verifica-se um atraso de tempo da previsão em relação aos valores reais da série, como pode ser exposto na figura a seguir.
Desta forma, o modelo proposto pela [gm]² supera tal problema dos modelos clássicos para a previsão de séries financeiras através de um procedimento de ajuste em relação a esse tempo de atraso associado a série.
Para mostrar a eficiência do modelo e procedimento, faremos o estudo de caso com séries relativas ao preço dos valores de ações.
A primeira série é a chamada série dos valores das ações da Google, que é uma série temporal financeira com observações diárias dos preços das ações da empresa Google, sendo constituída por 716 pontos.
O modelo proposto obteve, no conjunto de teste, um acerto de 99% em relação a direção da série temporal (ou seja, se o valor no tempo t+1 sobre ou desce em relação ao valor no tempo t), associado a um erro percentual de 0.3%. A Figura a seguir apresenta o gráfico da previsão gerada pelo modelo proposto.
A segunda série é a chamada série dos valores das ações da Amazon, que é uma série temporal financeira com observações diárias dos preços das ações da empresa Amazon, sendo constituída por 1758 pontos.
O modelo proposto obteve, no conjunto de teste, um acerto de 99% em relação a direção da série temporal (ou seja, se o valor no tempo t+1 sobre ou desce em relação ao valor no tempo t), associado a um erro percentual de 0.1%. A Figura a seguir apresenta o gráfico da previsão gerada pelo modelo proposto.
A terceira série é a chamada série dos valores das ações da General Motors Corporation, que é uma série temporal financeira com observações diárias dos preços das ações da empresa General Motors Corporation, sendo constituída por 1758 pontos.
O modelo proposto obteve, no conjunto de teste, um acerto de 97% em relação a direção da série temporal (ou seja, se o valor no tempo t+1 sobre ou desce em relação ao valor no tempo t), associado a um erro percentual de 0.8%. A Figura a seguir apresenta o gráfico da previsão gerada pelo modelo proposto.
A quarta e última série do nosso estudo de caso é a chamada série dos valores das ações da General Electric Company, que é uma série temporal financeira com observações diárias dos preços das ações da empresa General Electric Company, sendo constituída por 1758 pontos.
O modelo proposto obteve, no conjunto de teste, um acerto de 97% em relação a direção da série temporal (ou seja, se o valor no tempo t+1 sobre ou desce em relação ao valor no tempo t), associado a um erro percentual de 0.2%. A Figura a seguir apresenta o gráfico da previsão gerada pelo modelo proposto.
Assim, pode-se verificar que o modelo proposto pode ser aplicado tanto a previsão de séries naturais quanto a previsão de séries financeiras.
Desta forma, é possível estimar fenômenos de origem da natureza, demanda de energia elétrica, carga de energia elétrica, tempo, preço de ações, índices da bolsa, dentre outros. Portanto, a aplicabilidade e eficiência do modelo se comprovam através do estudo de caso feito.
_________________
Ricardo de A. Araújo
[gm]² Business Analyst
O Problema da Previsão de Séries Temporais
O principal objetivo da utilização de técnicas de previsão é a identificação de determinados padrões presentes no conjunto de dados, determinando assim, um modelo que seja capaz de reconstruir os próximos padrões temporais.
Muitos fatores influenciam o nível de detalhamentos utilizados na previsão de séries temporais: disponibilidade dos dados, precisão alcançável, custo de análise, etc.
Uma classe de decisões importante envolve os três elementos temporais: o período da previsão, o horizonte da previsão e o intervalo da previsão. O período da previsão é a unidade básica de tempo a qual as previsões são realizadas. O horizonte da previsão corresponde ao número de períodos cobertos, no futuro, pela previsão. Desta forma, é possível requerer uma previsão para as próximas dez semanas, com uma análise semanal, assim o horizonte seria dez semanas e o período de uma semana. Finalmente o intervalo da previsão é a freqüência com a qual novas previsões são preparadas.
Um outro aspecto para a definição do problema é a forma requerida da previsão. É conveniente conceber a variável de interesse como uma variável aleatória com uma distribuição de probabilidades desconhecida. O problema de decisão pode requerer uma estimativa de alguma característica desta distribuição de probabilidades, tal como a média, mediana ou valor mais provável, ou ainda, como medida de incerteza, com estimativas do desvio padrão, percentuais, ou um intervalo contendo uma alta probabilidade de um determinado valor. Também é importante considerar a disponibilidade de dados históricos sobre o problema, a precisão e a representatividade estatística de tais dados, sendo estas essenciais para o sucesso da previsão.
Os relacionamentos entre os dados históricos da série temporal constituem um espaço de fase d-dimensional. Desta maneira, um espaço de fase d-dimensional pode ser construído de tal forma que contenha toda a informação referente a uma série temporal de interesse. Takens provou que se d é suficientemente grande, tal espaço construído é homeomófico ao espaço de fase que originalmente gerou a série. O Teorema de Takens é então a justificativa teórica da possibilidade de reconstrução do espaço de fase utilizando os retardos temporais, e se tal espaço é construído corretamente, o teorema de Takens também garante que a dinâmica do espaço reconstruído é idêntica à dinâmica do espaço real.
O grande problema na reconstrução do espaço de fase é naturalmente a escolha da dimensionalidade d, ou mais precisamente, a escolha dos retardos temporais relevantes necessários para caracterização da dinâmica do sistema, ou seja, para a correta caracterização do processo que governa a série temporal em estudo.
_________________
Ricardo de A. Araújo
[gm]² Business Analyst
Uma Breve Introdução à Previsão de Séries Temporais
A possibilidade de se prever o comportamento dos fenômenos de forma a poder utilizá-los com maior eficiência e eficácia é de grande interesse para a sociedade, constituindo um ponto de extrema estratégia para um sistema de apoio a decisão que viabilize um meio de se poder cada vez mais conhecer os seus próprios negócios, com o intuito de obter um maior diferencial em um meio que é extremamente competitivo e dinâmico. Desta forma, é de suma importância o desenvolvimento de métodos que possam garantir o entendimento, com a maior precisão e o menor custo possível, dos fenômenos de interesse no desenvolvimento das entidades contidas nos meios não-lineares, dinâmicos e complexos.
De forma genérica, um meio bastante eficiente e seguro para a tomada de uma decisão é o conhecimento dos fatos futuros, das tendências e dos possíveis cenários que estão por acontecer através de um sistema de análise e apoio à tomada de decisão que, de alguma forma, deve ser capaz de realizar uma previsão dos acontecimentos relevantes, sendo esta previsão um elemento chave para o seu sucesso ou o fracasso.
O principal objetivo de se conhecer fatos futuros é a possibilidade de melhor se precaver as dificuldades que eventualmente possam acontecer. Para tanto, muitos esforços têm sido feitos para o desenvolvimento de técnicas que sejam capazes de determinar os acontecimentos futuros. Diversos modelos matemáticos e estatísticos têm sido utilizados, dentre os quais vale ressaltar os modelos de Box-Jenkins (ARIMA). Contudo, como tais modelos são lineares, existe a possibilidade de se gerar limitações intrínsecas se as séries temporais utilizadas forem geradas por fenômenos não-lineares, o que de forma geral pode ocorrer com as séries temporais do mundo real.
Com o intuito de descrever as não linearidades, vários modelos foram propostos com o objetivo de capturarem as informações necessárias para o mapeamento de acontecimentos do passado em fatos futuros, como os modelos bilineares, modelos de limiar auto-regressivos, modelos auto-regressivos exponenciais, modelos de estados gerais dependentes, dentre outros. Contudo, tais modelos não-lineares são bastante complexos, tanto matematicamente quanto computacionalmente, tornado a eficiência prática destas técnicas equivalentes à eficiência de previsão dos modelos lineares.
Assim, um novo e promissor conceito de não linearidade vem sendo bastante utilizado durante os últimos anos para a previsão de séries temporais com o intuito de superar as limitações dos modelos estatísticos lineares e não-lineares: as Redes Neurais Artificiais (RNA’s). As RNA’s representam uma técnica bastante eficiente para o problema de previsão de séries temporais devido a sua característica de modelagem de relações não-lineares complexas entre dados. As RNA’s são sistemas paralelos compostos por unidades de processamento simples (nós ou neurônios) que são dispostas em uma ou mais camadas interligadas por conexões relacionadas a pesos que estão associados ao conhecimento representado no modelo.
As RNA’s, assim como o cérebro humano, tem a capacidade de aprender a partir de um conjunto de dados de treinamento, o qual se extrai automaticamente os padrões necessários para representar a informação desejada, caracterizando a sua aprendizagem. A capacidade de aprender através de exemplos e de generalizar a informação aprendida é o grande atrativo das RNA’s, pois esta consegue mapear a informação através de um certo número de exemplos e posteriormente dar respostas coerentes para dados não-conhecidos, generalizando o conhecimento adquirido. Outra característica importante é a capacidade de auto-organização e de processamento temporal, fazendo assim as RNA’s uma ferramenta extremamente poderosa para a solução de problemas complexos.
Prever séries temporais significa representar as características de um determinado processo através de um modelo matemático e/ou computacional que possa estender tais características ao futuro, o que para tal é requerido que este modelo seja uma boa representação das observações em qualquer segmento de tempo próximo ao presente.
Algumas características de padrões em séries temporais são:
1. Processamentos que permanecem constantes sobre um certo nível todo o tempo, com variações de período a período devido a causas aleatórias.
2. Padrões que ilustram tendências no nível dos processos, de maneira que a variação de um período ao outro é atribuída a uma tendência mais uma variação aleatória.
3. Processos que variam ciclicamente no tempo, como em processos sazonais (exemplo: o clima).
A maioria dos modelos de séries temporais são desenvolvidos para representarem estes tipos de padrões de informação, ou uma combinação destes. Contudo é possível que algumas variações ocorram em tais padrões. Exemplos de tais variações são a ocorrência de transientes, impulsos; o aparecimento de degraus; e o aparecimento súbito de tendências.
Os modelos estatísticos que descrevem as séries temporais têm a forma geral:
onde bi são os parâmetros, e zi(t) são as funções matemáticas de tempo t, e {epsilon}t é a componente aleatória, ou ruído.
Contudo ainda existem outras formas de modelagens como a corrente observação de xt modelado como uma função das componentes aleatórias ordenadas temporalmente, do presente para o passado: {epsilon}t, {epsilon}t-1, {epsilon}t-2, …
onde {mu} é o nível (ou média) da série temporal e {psi}i são constantes. Este tipo de modelo é comumente chamado de “modelos de filtros lineares”, e é aplicado quando as observações são altamente correlacionadas.
Desta forma, a previsão de séries temporais consiste na estimativa dos parâmetros desconhecidos dos modelos apropriados para sua descrição, com o intuito de projetar tais modelos no futuro.
_________________
Ricardo de A. Araújo
[gm]² Business Analyst
Séries Temporais
Uma série temporal é uma seqüência de dados obtidos sobre um evento de interesse. Este conjunto pode ser obtido através de observações periódicas de tal evento, onde tais observações representam pontos temporais discretos ou contínuos, usualmente eqüidistantes. Logo, a análise de tal comportamento temporal envolve a descrição de um processo ou fenômeno que gera a seqüência.
Considerando uma determinada série discreta no tempo, sendo obtida continuamente durante um intervalo de tempo de amplitude T e, sendo o {delta}t o intervalo de amostragem, a quantidade de pontos da série é definida por
Logo, uma séria temporal pode ser representada pela equação a seguir
em que t é o índice temporal e N é o numero de observações. Assim, Xt é uma seqüência de observações ordenadas temporalmente e igualmente espaçadas.
O intervalo de amostragem, ou seja, o intervalo de tempo entre observações sucessivas é determinado normalmente pela disponibilidade dos dados e em alguns casos pelo próprio usuário.
_________________
Ricardo de A. Araújo
[gm]² Business Analyst






