Otimização De Trading Systems And Portafolios
Otimização de sistemas de negociação e carteiras quotResearch estudos tendem a se concentrar nos sistemas de negociação ou métodos de construção de carteira ou sistemas multi-agente (Smeureanu et al., 2012) separadamente. Alguns optaram por carteiras de sistema de negociação (Moodyand, Lizhong, 1997), (Dempster, Jones, 2001), mas muito poucos abordaram problemas de otimização de portfólio de sistemas comerciais em larga escala (Perold, 1984). Os sistemas multi-agentes raramente são usados na negociação, embora possam ser encontrados exemplos ocasionais (Arajo, de Castro 2011). Resumo: Para compreender as tarefas de construção de portfólio em larga escala, analisamos os problemas da economia sustentável, dividindo grandes tarefas em menores e oferecendo uma abordagem evolutiva baseada em sistema de feed-forward. A justificativa teórica para nossa solução é baseada em análise estatística multivariada de tarefas de investimento multidimensional, particularmente nas relações entre tamanho de dados, complexidade de algoritmos e eficácia de portfólio. Para reduzir o problema do tamanho da dimensão dimensional, uma tarefa maior é dividida em partes menores por meio de agrupamento de similaridades de itens. Problemas semelhantes são dados a grupos menores para resolver. Os grupos, no entanto, variam em muitos aspectos. Pseudo grupos formados aleatoriamente comporão um grande número de módulos de sistemas de tomada de decisão para alimentação avançada. O mecanismo de evolução forma coleções dos melhores módulos para cada curto período de tempo. As soluções finais são levadas para a escala global onde uma coleção dos melhores módulos é escolhida usando um perceptron sensível ao custo multiclass. Os módulos coletados são combinados em uma solução final em uma abordagem igualmente ponderada (1N Portfolio). A eficácia da nova abordagem de tomada de decisão foi demonstrada através de um problema de otimização de portfólio financeiro, que gerou quantidades adequadas de dados do mundo real. Para a construção de carteiras, utilizamos 11.730 performances simuladas de robôs comerciais. O conjunto de dados abrangeu o período de 2003 a 2012, quando as mudanças ambientais eram freqüentes e em grande parte imprevisíveis. Experiências avançadas e fora de amostra mostram que uma abordagem baseada em princípios de economia sustentável supera os métodos de referência e que o histórico de treinamento de agente mais curto demonstra melhores resultados nos períodos de um ambiente em mudança. Texto completo Artigo janeiro 2014 Raudys Aistis Raudys Pabarkait quotamp L Xu, (2003) quot Otimizando as carteiras financeiras sob a perspectiva de mineração de estruturas temporais de retornos de estoque, em P. Perner e A. Rosenfeld, eds. Aprendizado de máquinas e mineração de dados no reconhecimento de padrões - MLDMx272003, pp 266-275, LNAI 2734, Springer Verlag. Assim como outros problemas básicos na análise financeira, o ótimo problema de seleção de portfólio foi resiliente ao ataque de pesquisadores das disciplinas de redes neurais artificiais e aprendizado de máquina3456. O uso da abordagem das redes neurais requer parâmetros ideais para aprender de forma adaptativa ao longo do tempo. Resumo Neste trabalho, objetivamos introduzir como uma das técnicas de aprendizado estatístico recentemente desenvolvidas, a análise de fatores temporais (TFA), que é originalmente dedicada a um maior estudo da teoria de preços de arbitragem (APT) , Poderia ser explorado na mineração de dados financeiros para determinar pesos no problema de otimização de portfólio. Além disso, estudamos várias variantes da técnica de maximização da relação Sharpe, baseada em APT, que utilizam os conceitos de risco de queda da carteira e volatilidade ascendente adaptada à necessidade de risco - Aversos e agressivos investidores que buscam lucros Texto integral Documento de conferência Jul 2003 Kai Chun Chiu Lei Xu quotLinear regressão do tempo de espera para a proporção de MS em todos os mercados deu uma correlação co-eficiência de -48. Isso é consistente com os resultados em 1 e 4, que mostraram que o treinamento RRL adapta os comerciantes ao maior custo de transação, reduzindo a freqüência comercial. No caso da negociação de FX, uma taxa de MS menor significa que o spread é um custo de transação equivalente relativamente maior e devemos esperar que a freqüência de comércio seja reduzida. Resumo: Este estudo investiga comércio de moeda de alta freqüência com redes neurais treinadas através de aprendizagem de reforço recorrente (RRL). Comparamos o desempenho de redes de camada única com redes com uma camada oculta e examinamos o impacto dos parâmetros fixos do sistema no desempenho. Em geral, concluímos que os sistemas de negociação podem ser efetivos, mas o desempenho varia amplamente em diferentes mercados cambiais e essa variabilidade não pode ser explicada por estatísticas simples dos mercados. Também descobrimos que a rede de camada única supera a rede de duas camadas neste aplicativo. Conference Paper Apr 2003 Desenvolvimento Tecnológico e Econômico da Economia C. Goldby Amir F. Atiya, Alexander G. Parlos - IEEE TRANS. REDES NEURAIS. 2000. Como treinar eficientemente redes recorrentes continua a ser um tema de pesquisa desafiador e ativo. A maioria das abordagens de treinamento proposto são baseadas em formas computacionais para obter eficientemente o gradiente da função de erro e geralmente podem ser agrupadas em cinco grandes grupos. Neste estudo, presen. Como treinar eficientemente redes recorrentes continua a ser um tema de pesquisa desafiador e ativo. A maioria das abordagens de treinamento proposto são baseadas em formas computacionais para obter eficientemente o gradiente da função de erro e geralmente podem ser agrupadas em cinco grandes grupos. Neste estudo, apresentamos uma derivação que unifica essas abordagens. Demonstramos que as abordagens são apenas cinco maneiras diferentes de resolver uma equação matricial particular. O segundo objetivo deste artigo é desenvolver um novo algoritmo com base nos conhecimentos adquiridos com a nova formulação. O novo algoritmo, que se baseia na aproximação do gradiente de erro, tem menor complexidade computacional no cálculo da atualização de peso do que as técnicas concorrentes para a maioria dos problemas típicos. Além disso, atinge o erro mínimo em um número muito menor de iterações. Uma característica desejável dos algoritmos de treinamento de rede recorrentes é poder atualizar os pesos de forma on-line. Também desenvolvemos uma versão on-line do algoritmo proposto, que se baseia na atualização da aproximação do gradiente de erro de forma recursiva. Por Thomas Hellstrm, Kenneth Holmstrm. 1999. Este artigo descreve o ASTA, um agente de negociação de ações artificiais, no ambiente de programação Matlab. O objetivo principal do projeto é fornecer um banco de testes estável e realista para o desenvolvimento de algoritmos de negociação de ações múltiplas. O comportamento do agente é controlado por uma lingua de alto nível. Este artigo descreve o ASTA, um agente de negociação de ações artificiais, no ambiente de programação Matlab. O objetivo principal do projeto é fornecer um banco de testes estável e realista para o desenvolvimento de algoritmos de negociação de ações múltiplas. O comportamento do agente é controlado por uma linguagem de alto nível, que é facilmente extensível às funções definidas pelo usuário. As regras de compra e venda podem ser compostas de forma interativa e vários tipos de rastreio de dados podem ser facilmente executados, tudo dentro da sintaxe da linguagem de arquivo m-Matlab. Além de Haizhon Li, Robert Kozma - Procedimentos da Conferência Conjunta Internacional de 2003 sobre Redes Neurais. 2003. Resumo Neste artigo, a rede neural dinâmica do KIII é introduzida e é aplicada à predição de sequências temporais complexas. Em nossa abordagem, o KIII dá uma previsão passo a passo da direção da mudança da taxa de câmbio. Anteriormente, várias redes de perceptron multiplayer (MLP). Resumo Neste artigo, a rede neural dinâmica do KIII é introduzida e é aplicada à predição de sequências temporais complexas. Em nossa abordagem, o KIII dá uma previsão passo a passo da direção da mudança da taxa de câmbio. Anteriormente, várias redes de perceptron multiplayer (MLP) e redes neurais recorrentes foram implementadas com sucesso para esta aplicação. Os resultados obtidos por KIII comparam favoravelmente com outros métodos. Eu sou o alto nível de ruído e a natureza não estacionária dos dados, a previsão financeira é uma aplicação desafiadora no domínio da predição de séries temporais. Vários métodos são usados nesta aplicação -4,5,6,7,9,10--. Neste trabalho, usamos o modelo KIII para prever a direção de um passo da taxa de câmbio diária. Os dados que usamos são de 4. Os resultados da experiência mostram a capacidade de classificação do KI. Por Nicolas Chapados, Yoshua Bengio - Transações IEEE em Redes Neurais. 2000. Apresentamos um quadro de alocação de ativos baseado no controle ativo do valor em risco do portfólio. Nessa estrutura, comparamos dois paradigmas para fazer a alocação usando redes neurais. O primeiro usa a rede para fazer uma previsão de comportamento de ativos, em conjunto com a. Apresentamos um quadro de alocação de ativos baseado no controle ativo do valor em risco do portfólio. Nessa estrutura, comparamos dois paradigmas para fazer a alocação usando redes neurais. O primeiro usa a rede para fazer uma previsão do comportamento dos ativos, em conjunto com um alocador de variância média tradicional para a construção do portfólio. O segundo paradigma usa a rede para tomar diretamente as decisões de alocação de portfólio. Consideramos um método para executar a seleção de variáveis de entrada suave e mostra sua utilidade considerável. Usamos métodos de combinação de modelos (comitês) para sistematizar a escolha de hiperparemeters durante o treinamento. Mostramos que os comitês que usam ambos os paradigmas estão superando significativamente o desempenho do mercado de referência. 1. Introdução Nos aplicativos de finanças, a idéia de treinar algoritmos de aprendizado de acordo com o critério de interesse (como lucro) em vez de um critério de predição genérica, ganhou interesse nos últimos anos. I. critério, ganhou interesse nos últimos anos. Nas tarefas de alocação de ativos, isso foi aplicado ao treinamento de redes neurais para maximizar diretamente um Ratio Sharpe ou outras medidas de lucro ajustadas ao risco -1,3,10--. Uma dessas medidas de risco que recebeu recentemente atenção considerável é o valor-em-risco (VaR) do portfólio, que determina a quantidade máxima (geralmente medida em, por exemplo) que o portfol. Por John Moody, Yufeng Liu, Matthew Saffell, Kyoungju Youn - Em Proceedings of Artificial Multiagent Learning. Artigos do Simpósio de Outono AAAI de 2004. 2004. Nós investigamos os jogos de matriz repetidos com jogadores estocásticos como um microcosmo para o estudo de interações dinâmicas e multi-agente usando o algoritmo de gradiente de política estocástica de reforço direto (SDR). SDR é uma generalização do Recorrent Reinforcement Learning (RRL) que suporta políticas estocásticas. U. Nós investigamos jogos de matriz repetidos com jogadores estocásticos como um microcosmo para o estudo de interações dinâmicas multi-agente usando o algoritmo de gradiente de política estocástica de reforço direto (SDR). SDR é uma generalização do Recorrent Reinforcement Learning (RRL) que suporta políticas estocásticas. Ao contrário de outros algoritmos RL, SDR e RRL usam gradientes de políticas recorrentes para endereçar adequadamente a atribuição de crédito temporal resultante da estrutura recorrente. Nossos principais objetivos neste artigo são (1) distinguir a memória recorrente da memória padrão e não recorrente para o RL de gradiente de política, (2) comparar SDR com métodos de aprendizagem de tipo Q para jogos simples, (3) distinguir o agente dinâmico reativo do endógeno Comportamento e (4) explorar o uso da aprendizagem recorrente para agentes dinâmicos e interativos. Nós achamos que os jogadores SDR aprendem muito mais rápido e, portanto, superam os aprendentes do tipo Q recentemente propostos para o jogo simples Rock, Paper, Scissors (RPS). Com jogadores e opositores SDR mais complexos e dinâmicos, demonstramos que as representações recorrentes e os gradientes de políticas recorrentes SDR apresentam um melhor desempenho do que os jogadores não recorrentes. Para o Dilema dos Prisioneiros Iterados, mostramos que os agentes SDR não-recorrentes aprendem apenas a defeito (equilíbrio de Nash), enquanto os agentes SDR com gradientes recorrentes podem aprender uma variedade de comportamentos interessantes, inclusive a cooperação. 1 ealing, Q-Learning não pode ser facilmente escalado para o grande estado ou espaços de ação que geralmente ocorrem na prática. Métodos de reforço direto (DR) (gradiente de política e pesquisa de políticas) (Williams 1992) (- Moody amp Wu 1997 -) (Moody et al., 1998) (Baxter amp Bartlett 2001) (Ng amp Jordan 2000) representam políticas explicitamente e fazem Não exige que uma função de valor seja aprendida. Os métodos de gradiente de política buscam melhorar a política por meio de. Por John Moody, Matthew Saffell - no KDD. 1998. Propomos a formação de sistemas de negociação através da otimização de funções objetivas fi nanceiras através da aprendizagem de reforço. As funções de desempenho que consideramos como funções de valor são o lucro ou a riqueza, a relação de Sharpe e nossa relação Sharpe diferencial recentemente proposta para a aprendizagem on-line. No Moody amp. W. Proponemos a formação de sistemas de negociação através da otimização de funções objetivas fi nanceiras através da aprendizagem de reforço. As funções de desempenho que consideramos como funções de valor são o lucro ou a riqueza, a relação de Sharpe e nossa relação Sharpe diferencial recentemente proposta para a aprendizagem on-line. Em Moody ampamp Wu (1997), apresentamos resultados empíricos em experimentos controlados que demonstram as vantagens da aprendizagem de reforço em relação à aprendizagem supervisionada. Aqui, estendemos nosso trabalho prévio para comparar Q-Learning com uma técnica de aprendizado de reforço baseada em aprendizado recorrente em tempo real (RTRL) que maximiza a recompensa imediata. Nossos resultados de simulação incluem uma demonstração espetacular da presença de previsibilidade mensal por N. Towers, A. N. Burgess - Finanças computacionais. Procedimentos da Sexta Conferência Internacional sobre Finanças Computacionais (The. 1999. Neste artigo, implementamos estratégias de negociação para modelos de previsão de preços de ativos usando regras de decisão parametrizadas. Desenvolvemos um ambiente de negociação sintético para investigar os efeitos relativos, em termos de rentabilidade, de modificação O modelo de previsão e a regra de decisão. Mostramos que imp. Neste artigo, implementamos estratégias de negociação para modelos de previsão de preços de ativos usando regras de decisão parametrizadas. Desenvolvemos um ambiente de negociação sintético para investigar os efeitos relativos, em termos de rentabilidade, de modificar o Modelo de previsão e a regra de decisão. Mostramos que a implementação da regra de negociação pode ser tão importante para o desempenho comercial como a capacidade preditiva do modelo de previsão. Aplicamos essas técnicas para um exemplo de um modelo de previsão gerado a partir de um intervalo intramédico De uma combinação de índices de participação. Os resultados indicam que A otimização das regras de decisão pode melhorar significativamente o desempenho da negociação, com o Ratio de Sharpe anualizado aumentando até um fator de duas sobre uma regra de comércio de nave. Para atingir esse nível de aumento de desempenho através do modelo de previsão, seria necessário uma melhoria de 50 na precisão da predição. 1 Introdução Nos últimos anos, uma quantidade substancial de pesquisas tem sido dedicada. O modelo de previsão e, em segundo lugar, uma fase de decisão que converte as informações de previsão em uma ação que, neste caso, altera a posição de negociação. Como alternativa, Moody in -3-- e Choey amp Weigend em 4, são exemplos de metodologias que combinam esses dois estágios em um. Essas estratégias de negociação usam um único modelo para realizar uma otimização conjunta tanto na previsão quanto na previsão. Por Thomas Hellstrm. 1998. Este artigo descreve os princípios por trás e a implementação do ASTA, um agente de negociação de ações artificial escrito na língua Matlab. O objetivo principal do projeto é fornecer um ambiente fácil de usar para o desenvolvimento de algoritmos de negociação de ações múltiplas. Este artigo descreve os princípios por trás e a implementação do ASTA, um agente de negociação de ações artificial escrito na língua Matlab. O objetivo principal do projeto é fornecer um ambiente fácil de usar para o desenvolvimento de algoritmos de negociação de ações múltiplas. Por N. Towers, A. N. Burgess. 1998. No contexto de uma estratégia de negociação dinâmica, o objetivo final de qualquer modelo de previsão é escolher ações que resultem na otimização do objetivo comercial. Neste artigo, desenvolvemos uma metodologia para otimizar uma função objetiva, usando uma regra de decisão parametrizada, para uma doação. No contexto de uma estratégia de negociação dinâmica, o objetivo final de qualquer modelo de previsão é escolher ações que resultem na otimização do objetivo comercial. Neste artigo desenvolvemos uma metodologia para otimizar uma função objetiva, usando uma regra de decisão parametrizada, para um modelo de previsão determinado. Simulamos o desempenho comercial esperado para diferentes parâmetros de decisão e níveis de precisão de previsão. Em seguida, aplicamos a técnica a um modelo de previsão de mispricing dentro de um grupo de índices de ações. Mostramos que a otimização da regra de decisão proposta pode aumentar o Ratio Sharpe anualizado por um fator de 1,7 em relação a uma norma de decisão ingênua. Por Kai Chun Chiu, Lei Xu - em J. R. Dorronsoro (Ed.): Redes Neurais Artificiais - ICANN2002, LNCS 2415. 2002. Abstrato. O gerenciamento de portfólio adaptativo foi estudado na literatura de redes neurais e aprendizado automático. O modelo recentemente desenvolvido de Análise de Fator Temporal (TFA), principalmente orientado para o estudo prévio da Teoria do Preço do Arbitragem (APT), possui aplicações potenciais em homem de portfólio. Abstrato. O gerenciamento de portfólio adaptativo foi estudado na literatura de redes neurais e aprendizado automático. O modelo recentemente desenvolvido de Análise de Fator Temporal (TFA), principalmente orientado para o estudo prévio da Teoria do Preço Arbitrage (APT), possui aplicações potenciais no gerenciamento de portfólio. Neste artigo, pretendemos ilustrar a superioridade do gerenciamento de portfólio baseado em APT em relação ao gerenciamento de portfólio baseado em retorno. 1 e Markowitzs tradicional teoria do portfólio 8 no contexto das redes neurais artificiais. Na literatura, o gerenciamento adaptativo de portfólio através da maximização da conhecida razão Sharpe 4 foi estudado em -1, 2 -. No entanto, essas abordagens tratam os pesos como constantes ou dependem diretamente dos retornos de segurança. Recentemente, uma nova técnica chamada Análise de Fator Temporal (TFA) foi proposta por 5 com uma optimização de sistemas de negociação e carteiras quot. Os estudos de pesquisa tenderam a se concentrar nos sistemas de negociação ou métodos de construção de carteira ou sistemas multi-agente (Smeureanu et al., 2012 ) Separadamente. Alguns optaram por carteiras de sistema de negociação (Moodyand, Lizhong, 1997), (Dempster, Jones, 2001), mas muito poucos abordaram problemas de otimização de portfólio de sistemas comerciais em larga escala (Perold, 1984). Os sistemas multi-agentes raramente são usados na negociação, embora possam ser encontrados exemplos ocasionais (Arajo, de Castro 2011). Resumo: Para compreender as tarefas de construção de portfólio em larga escala, analisamos os problemas da economia sustentável, dividindo grandes tarefas em menores e oferecendo uma abordagem evolutiva baseada em sistema de feed-forward. A justificativa teórica para nossa solução é baseada em análise estatística multivariada de tarefas de investimento multidimensional, particularmente nas relações entre tamanho de dados, complexidade de algoritmos e eficácia de portfólio. Para reduzir o problema do tamanho da dimensão dimensional, uma tarefa maior é dividida em partes menores por meio de agrupamento de similaridades de itens. Problemas semelhantes são dados a grupos menores para resolver. Os grupos, no entanto, variam em muitos aspectos. Pseudo grupos formados aleatoriamente comporão um grande número de módulos de sistemas de tomada de decisão para alimentação avançada. O mecanismo de evolução forma coleções dos melhores módulos para cada curto período de tempo. As soluções finais são levadas para a escala global onde uma coleção dos melhores módulos é escolhida usando um perceptron sensível ao custo multiclass. Os módulos coletados são combinados em uma solução final em uma abordagem igualmente ponderada (1N Portfolio). A eficácia da nova abordagem de tomada de decisão foi demonstrada através de um problema de otimização de portfólio financeiro, que gerou quantidades adequadas de dados do mundo real. Para a construção de carteiras, utilizamos 11.730 performances simuladas de robôs comerciais. O conjunto de dados abrangeu o período de 2003 a 2012, quando as mudanças ambientais eram freqüentes e em grande parte imprevisíveis. Experiências avançadas e fora de amostra mostram que uma abordagem baseada em princípios de economia sustentável supera os métodos de referência e que o histórico de treinamento de agente mais curto demonstra melhores resultados nos períodos de um ambiente em mudança. Texto completo Artigo janeiro 2014 Raudys Aistis Raudys Pabarkait quotamp L Xu, (2003) quot Otimizando as carteiras financeiras sob a perspectiva de mineração de estruturas temporais de retornos de estoque, em P. Perner e A. Rosenfeld, eds. Aprendizado de máquinas e mineração de dados no reconhecimento de padrões - MLDMx272003, pp 266-275, LNAI 2734, Springer Verlag. Assim como outros problemas básicos na análise financeira, o ótimo problema de seleção de portfólio foi resiliente ao ataque de pesquisadores das disciplinas de redes neurais artificiais e aprendizado de máquina3456. O uso da abordagem das redes neurais requer parâmetros ideais para aprender de forma adaptativa ao longo do tempo. Resumo Neste trabalho, objetivamos introduzir como uma das técnicas de aprendizado estatístico recentemente desenvolvidas, a análise de fatores temporais (TFA), que é originalmente dedicada a um maior estudo da teoria de preços de arbitragem (APT) , Poderia ser explorado na mineração de dados financeiros para determinar pesos no problema de otimização de portfólio. Além disso, estudamos várias variantes da técnica de maximização da relação Sharpe, baseada em APT, que utilizam os conceitos de risco de queda da carteira e volatilidade ascendente adaptada à necessidade de risco - Aversos e agressivos investidores que buscam lucros Texto integral Documento de conferência Jul 2003 Kai Chun Chiu Lei Xu quotLinear regressão do tempo de espera para a proporção de MS em todos os mercados deu uma correlação co-eficiência de -48. Isso é consistente com os resultados em 1 e 4, que mostraram que o treinamento RRL adapta os comerciantes ao maior custo de transação, reduzindo a freqüência comercial. No caso da negociação de FX, uma taxa de MS menor significa que o spread é um custo de transação equivalente relativamente maior e devemos esperar que a freqüência de comércio seja reduzida. Resumo: Este estudo investiga comércio de moeda de alta freqüência com redes neurais treinadas através de aprendizagem de reforço recorrente (RRL). Comparamos o desempenho de redes de camada única com redes com uma camada oculta e examinamos o impacto dos parâmetros fixos do sistema no desempenho. Em geral, concluímos que os sistemas de negociação podem ser efetivos, mas o desempenho varia amplamente em diferentes mercados cambiais e essa variabilidade não pode ser explicada por estatísticas simples dos mercados. Também descobrimos que a rede de camada única supera a rede de duas camadas neste aplicativo. Documento de conferência Apr 2003 Desenvolvimento tecnológico e econômico da economia C. Gold
Comments
Post a Comment