Estrategia de negociación grados de libertad






+

La prueba requiere el número de reglas y / o restricciones impuestas por el sistema de comercio o método. El número de normas y / o restricciones se utiliza para calcular el número de grados de libertad. que es necesario calcular el valor de t para la prueba t. Es necesario que haya un número suficiente de grados de libertad para asegurar que el sistema no está sobre-ajuste o sobre-optimizado para el mercado. El exceso de montaje o sobre-optimización significa que los parámetros del sistema de comercio han sido seleccionados para trabajar en mercados específicos o en condiciones de mercado limitadas. Una es poco probable que un buen desempeño en otros mercados o cuando las condiciones del mercado cambian con el ajuste o el sistema de comercio más optimizado. La mayoría de los expertos están de acuerdo en que los sistemas de comercio de sobre-optimizados deben ser evitados. El número de grados de libertad es el número de operaciones menos el número de restricciones. Con muy pocas operaciones, la rentabilidad del sistema o método puede ser debido a una disposición de oportunidad de las operaciones. Los oficios más, cuanto mayor sea el número de grados de libertad y lo más probable es que el beneficio medio calculado no es una casualidad estadística, sino un número real que es probable que se mantenga en el futuro. Para contar el número de restricciones, Thomas Hoffman (Babcock, Bruce. El Business One Guía Irwin a los Sistemas de Trading. Richard D. Irwin, Inc. 1989, p. 89) sugiere examinar las reglas de un sistema comercial y contando cualquier condición que cambiaría el resultando oficios. Por ejemplo, suponga que tiene un sistema de comercio que compra al cierre de hoy es menor que el cierre de ayer en una tendencia hacia arriba. Se define una tendencia como cuando una media móvil más corta es mayor que un promedio móvil más larga. Para simplificar, supongamos que el lado de la venta es la inversa, y no hay paradas. Es una parada sencilla y sistema de inversión. El promedio estado cruzado en movimiento probablemente se cuenta como tres restricciones: una para la condición en sí, y una para cada período de media móvil. El patrón de precio sería otra restricción para un total de cuatro restricciones para el lado largo. No habría cuatro más para el lado corto para un total de ocho restricciones. Si sólo había ocho oficios, por ejemplo, no habría grados de libertad, y no debe tener ninguna confianza en el número promedio de comercio, aunque fuera muy alto. Por otra parte, si había 100 operaciones, habría 92 grados de libertad, que debe darle mucha más confianza en la cantidad media del comercio. Prueba T para que t puede expresarse como un intervalo de confianza para la media del comercio: CI = t * SD / sqrt (N) donde IC es el intervalo de confianza en torno a la media del comercio, t es estadístico t de Student, SD es la desviación estándar de los oficios, N es el número de operaciones, y sqrt representa la raíz cuadrada. El estadístico t depende del número de grados de libertad y el nivel de confianza. El intervalo de confianza significa que es probable que se encuentre entre T la media del comercio - CI y T + IC. Para que el sistema sea rentable en el nivel de confianza especificado, la media del comercio, T. tiene que ser mayor que cero en el límite inferior, T - CI; es decir Si se cumple esta condición en el nivel de confianza especificado, significa que el sistema o método es inherentemente sujetas rentable a los supuestos de la prueba. Uno de estos supuestos es que las propiedades estadísticas de las operaciones siguen siendo los mismos. En concreto, si la media del comercio y su desviación estándar siguen siendo los mismos en el futuro, los resultados seguirán siendo válidas. Sin embargo, ya que los mercados cambian y evolucionan con el tiempo, las propiedades de la distribución estadística de las operaciones pueden cambiar, así que debe tener precaución en la interpretación de los resultados. Objetivos de aprendizaje Definir grados de libertad Calcula la varianza de una muestra de 1 si la media de la población es conocida Estado ¿por desviaciones de la media muestral no son independientes Indique la fórmula general para los grados de libertad en términos de la cantidad de valores y el número de parámetros estimados Calcular s 2 Algunas estimaciones están basadas en más información que otros. Por ejemplo, una estimación de la varianza basada en un tamaño de muestra de 100 se basa en más información que una estimación de la varianza basado en una muestra de 5. Los grados de libertad (df) de una estimación es el número de piezas independientes de la información en que se basa la estimación. A modo de ejemplo, digamos que sabemos que la altura media de los marcianos es 6 y deseamos estimar la varianza de sus alturas. Nos muestra al azar un marciano y encontramos que su altura es de 8. Recordemos que la varianza se define como la media al cuadrado desviación de los valores de decir su población. Podemos calcular la desviación al cuadrado de nuestro valor de 8 de la media de la población de 6 a encontrar una sola desviación al cuadrado de la media. Esta sola desviación al cuadrado de la media, (8-6) 2 = 4, es una estimación de la media al cuadrado desviación para todos los marcianos. Por lo tanto, en base a esta muestra de uno, nos estimamos que la varianza de la población es 4. Esta estimación se basa en una única pieza de información y por lo tanto tiene 1 df. Si probamos otra marciana y obtuvimos una altura de 5, entonces podríamos calcular una segunda estimación de la varianza, (5-6) 2 = 1. Podríamos entonces un promedio de nuestros dos estimaciones (4 y 1) para obtener una estimación de 2,5 . Dado que esta estimación se basa en dos piezas independientes de información, cuenta con dos grados de libertad. Las dos estimaciones son independientes, ya que se basan en dos marcianos seleccionados de forma independiente y al azar. Las estimaciones no sería independiente si después de probar de un marciano, decidimos elegir a su hermano como nuestro segundo marciano. Como usted probablemente está pensando, es bastante raro que sabemos que la media poblacional cuando estamos estimando la varianza. En su lugar, tenemos que calcular primero la media de la población (y mu;) con la media de la muestra (M). El proceso de estimación de la media afecta a nuestros grados de libertad, como se muestra a continuación. Volviendo a nuestro problema de la estimación de la varianza en las alturas de Marte, vamos a suponer que no sabemos la media poblacional y por lo tanto tenemos que estimar a partir de la muestra. Hemos probado dos marcianos y encontró que su altura es de 8 y 5. Por lo tanto M, nuestra estimación de la media poblacional, es M = (8 + 5) / 2 = 6,5. Ahora podemos calcular dos estimaciones de la varianza: Estimar 1 = (8-6,5) 2 = 2,25 Estimar 2 = (5-6,5) 2 = 2,25 Ahora para la pregunta clave: ¿Son estas dos estimaciones independientes? La respuesta es no, porque cada altura contribuyó al cálculo de M. Desde la altura de la primera marciana de 8 influido M, también influyó Estimación 2. Si la primera altura había sido, por ejemplo, 10, entonces M habría sido 7,5 y Estimación 2 habría sido (5-7,5) 2 = 6,25 en lugar de 2,25. El punto importante es que las dos estimaciones no son independientes y por lo tanto no tienen dos grados de libertad. Otra forma de pensar acerca de la falta de independencia es considerar que si supieras la media y una de las puntuaciones, sabrías la otra partitura. Por ejemplo, si un puntaje es 5 y la media es de 6,5, se puede calcular que el total de los dos resultados es 13, por lo que el otro puntaje debe ser 13-5 = 8. En general, los grados de libertad para una estimación es igual al número de los valores menos el número de parámetros estimados en el camino a la estimación en cuestión. En el ejemplo de los marcianos, hay dos valores (8 y 5) y tuvimos que estimar un parámetro (y mu;) en el camino a la estimación del parámetro de interés (y sigma, 2). Por lo tanto, la estimación de la varianza ha 2 - 1 = 1 grado de libertad. Si hubiéramos muestreado 12 marcianos, entonces nuestra estimación de la varianza habría tenido 11 grados de libertad. Por lo tanto, los grados de libertad de una estimación de la varianza es igual a N - 1, donde N es el número de observaciones. Recordemos de la sección sobre la variabilidad que la fórmula para la estimación de la varianza de una muestra es: El denominador de esta fórmula es el grado de libertad. Por favor, responda a las preguntas: Hacia un paladar más simple Mi boca es más simple de lo que solía ser. Un joven chef agrega y agrega y se suma a la placa. A medida que envejece, usted comienza a llevar. Jacques Pépin, famoso chef francés La serie actual artículo trata sobre el concepto de decadencia rendimiento, que se produce cuando el rendimiento de una estrategia de negociación sistemática es materialmente peor en aplicación de lo que parecía durante la prueba. Nos topamos con el concepto de arbitraje en nuestro último mensaje, haciendo un paralelo con el fenómeno del descubrimiento múltiple en la ciencia. En esencia, la hipótesis de que muchos desarrolladores de dibujo de un organismo similar de la investigación serán tropezar con aplicaciones similares en aproximadamente el mismo tiempo. A medida que estos inversores compiten para cosechar los mismos o similares anomalías, cada inversor cosechará una proporción menor de la alfa disponible. También tocamos en razones por las que estamos seguros de que las estrategias de asignación de activos activo reflexivos tienden a preservar su fuerte perfil de rentabilidad ajustada al riesgo en el futuro previsible. Recordemos que una variedad de obstáculos estructurales a prevenir grandes intereses monetarios contemporáneos como las pensiones, fundaciones y otras instituciones grandes de la explotación de esta oportunidad de arbitraje. En el fondo, estos grandes grupos de capital se ven limitados por pensamiento de grupo, estructura corporativa y de lento movimiento procedimientos de gobierno. Estas restricciones excluyen la posibilidad de migrar su enfoque de las fuentes tradicionales de alfa (es decir, de selección de seguridad) a fuentes tácticas. Este post comienza nuestra exploración del concepto de grados de libertad en el desarrollo del sistema. Los grados de libertad plazo tiene significados ligeramente diferentes dependiendo de si el contexto es estadísticas formales o sistemas mecánicos. Mientras que el diseño del sistema de inversión a menudo se basa en ambos contextos, para el propósito de esta serie vamos a sesgar mucho más cerca de este último. Esencialmente, el número de grados de libertad en un sistema se refiere al número de parámetros independientes en el sistema que pueda afectar los resultados. Cuando descubrí por primera vez la inversión sistemática, mi intuición era encontrar tantas formas de medir y filtrar series de tiempo como podría caber en una hoja de cálculo Excel. Yo era como un niño que había probado una bouillabaisse inspirado por primera vez, y sólo tenía que tratar de replicar yo mismo. Pero en lugar de explorar la interminable matices de la cocina francesa, sólo tiré toda planta francesa concebible en la olla a la vez. A saber, uno de mis primeros diseños tenían no menos de 37 clasificadores, incluyendo filtros relacionados con regresiones, medias móviles, el impulso prima, indicadores técnicos como el RSI y Estocástico, así como la tendencia más elegante y significa filtros de reversión como ETI, DVI, DVO, y una serie de otras tres y cuatro siglas letras. Cada indicador fue finamente sintonizado a valores óptimos para maximizar los rendimientos históricos, y estos valores ha cambiado como yo optimizado contra diferentes valores. En un momento he diseñado un sistema para el comercio IWM con una rentabilidad histórica por encima del 50% y un ratio de Sharpe más de 4. Estos son los tipos de sistemas que realizan increíblemente bien en retrospectiva y luego soplan en la producción, y eso es exactamente lo que sucedió. Mi pareja aplica el sistema de IWM de acciones estadounidenses de tiempo para un par de semanas, y perdió 25%. Decenas de horas y semanas de horas de la noche en el equipo por el desagüe. El problema con los sistemas complejos con muchas partes móviles es que te obligan a encontrar el punto perfecto exacta de optimización en muchas dimensiones diferentes en mi caso, 37. Para entender lo que quiero decir con esto, imagínese tratando de crear un plato sabroso con 37 diferentes ingredientes. ¿Cómo pudiste encontrar la combinación perfecta? Un poco más de sal puede realzar el sabor del romero, pero podría dominar al aceite de trufa. ¿Qué hacer? Añadir más sal y más aceite de trufa? Pero más aceite de trufa puede no complementar la terrenalidad de los níscalos. Usted ve que isnt suficiente simplemente encontrar el óptimo local para cada clasificador individual, más de lo que puede decidir sobre la cantidad óptima de cualquier ingrediente en un plato sin tener en cuenta su impacto en el resto de ingredientes. Eso es porque, en la mayoría de los casos la señal de un clasificador interactúa con otros clasificadores de formas no lineales. Por ejemplo, si usted opera con dos filtros en combinación decir una cruz media móvil y un oscilador que ya no están preocupados por la duración óptima de la media (s) en movimiento o los períodos de vista al pasado para el oscilador de forma independiente; más bien, debe examinar los resultados del oscilador durante los períodos en que el precio está por encima de la media móvil, y de nuevo cuando el precio está por debajo de la media móvil. Usted puede encontrar que el oscilador se comporta de manera muy diferente cuando el filtro de media móvil se encuentra en un estado que lo hace en otro estado. Para que os hagáis una idea del alcance de este desafío, considere una simplificación que cada clasificador tiene sólo 12 configuraciones posibles, por ejemplo un rango de vista al pasado de 1 a 12 meses. 37 clasificadores con 12 posibles opciones por clasificador representa 6,6 x 10 ^ 18 permutaciones posibles. Mientras unos permutaciones quintillones pueden no parecer una simplificación, tenga en cuenta que muchos de los clasificadores en mi sistema IWM 37 dimensión tenido dos o tres parámetros de su propia (retroactivo corto, vista al pasado de largo, puntuación z, p valor, etc.), y cada de esos parámetros también se optimizó. No importa encontrar una aguja en un pajar, esto es como encontrar un grano particular de arena en la playa. Hay otro problema así: cada vez que se divide el sistema en dos o más estados que por definición a reducir el número de observaciones en cada estado. Para ilustrar esto, imagínese si cada uno de los 37 clasificadores en mi sistema IWM tenían sólo 2 estados largas o en efectivo. Entonces no habría 2 ^ 37 = 137000000000 posibles estados del sistema. Recordemos que la significación estadística depende del número de observaciones, reduciendo así el número de observaciones por estado del sistema reduce la significación estadística de los resultados observados para cada estado, y también para el sistema en su conjunto. Por ejemplo, tener un sistema que cotiza diariamente con 20 años de historia de pruebas. Si divide un 20 años ( 5000 días) periodo en 137 mil millones de posibles estados, cada estado tendrá en promedio sólo 5000/137 millones = 0,00000004 observaciones por estado! Es evidente que 20 años de historia no es bastante tener ninguna confianza en este sistema; que se necesita un período de prueba de más de 3 millones de años para obtener significación estadística. Como regla general, mientras más grados de libertad que su modelo tiene, mayor es el tamaño de la muestra que se requiere para demostrar la significación estadística. Lo contrario también es cierto: dado el mismo tamaño de la muestra, un modelo con menos grados de libertad es probable que tenga mayor significación estadística. En el mundo de la inversión, si usted está buscando en los resultados de copia de prueba de dos modelos de inversión con un rendimiento similar, se debe generalmente tener más confianza en el modelo con menos grados de libertad. Por lo menos, podemos decir que los resultados de ese modelo tendría mayor significación estadística, y una mayor probabilidad de obtener resultados en la producción que son consistentes con lo observado en la simulación. ¿Cuántas copas de bouillabaisse tendrías que probar para estar seguro youd encontrar la combinación perfecta de ingredientes? Debido a esto, la optimización, como la cocina, debe llevarse a cabo de una manera integrada que da cuenta de todas las dimensiones del problema a la vez. Y esta es la fuerza impulsora detrás de la extraña realidad que muchas veces en el mundo de invertir, como con la cocina, los novatos buscan complejidad, mientras que los veteranos buscan simplicidad. Esto es contrario a la intuición, incluso para los profesionales de la inversión, por lo que el diseño del sistema tiene una curva de aprendizaje extraño donde la tendencia es moverse muy rápidamente lejos del enfoque simple que te introdujo al comercio sistemática en el primer lugar (en nuestro caso Fabers trabajan junto con el cartista y Dorsey Wright) hacia diseños muy complejos, cada uno con una configuración óptima muy preciso. Con el tiempo se reconoce la locura de esta búsqueda, y trabajar hacia atrás, hacia la coherencia y la simplicidad. Por supuesto, simple no significa fácil, no más que un novato puede seguir una receta simple para recrear una obra maestra culinaria. Como usted descubrirá, sencillez reflexivo puede ser engañosamente compleja. Le daremos un ejemplo de que en nuestro próximo artículo. Por ahora, por favor, pásame la sal y la pimienta. Escrito por GestaltU el Miércoles, 05 de febrero 2014 a las 5:30 am. [Early redactar sujetos a cambios.] Una de las preguntas que un instrutor teme más de un público poco sofisticado matemáticamente es: "¿Qué es exactamente grados de libertad?" No es que no hay una respuesta. La respuesta matemática es una sola frase: "El rango de una forma cuadrática." El problema es traducir eso a un público cuyo conocimiento de las matemáticas no se extiende más allá de las matemáticas de la escuela secundaria. Una cosa es decir que los grados de libertad es un índice y para describir la forma de calcular para ciertas situaciones, pero ninguna de estas piezas de información le indica qué grados de libertad significa. Como alternativa a "la categoría de una forma cuadrática", siempre me ha gustado el artículo 1973 de Jack Bueno en el American Estadístico "¿Cuáles son los grados de libertad?" 27, 227 a 228, en la que equivale grados de libertad a la diferencia en dimensionalidades de espacios de parámetros. Sin embargo, esta es una respuesta parcial. En él se explica lo que los grados de libertad es para muchas pruebas de chi-cuadrado y los grados de libertad del numerador para las pruebas de F, pero no lo hace así con pruebas t o los grados de libertad del denominador para las pruebas de F. Por el momento, me inclino a definir grados de libertad como una forma de mantener el marcador. Un conjunto de datos contiene una serie de observaciones, digamos, n. Constituyen piezas n individuales de información. Estas piezas de información se pueden utilizar para estimar parámetros o variabilidad. En general, cada elemento que se estima los costos de un grado de libertad. El resto de grados de libertad se utilizan para estimar la variabilidad. Todo lo que tenemos que hacer es contar correctamente. Una sola muestra: Hay n observaciones. Hay un parámetro (la media) que necesita ser estimada. Eso deja a n-1 grados de libertad para la estimación de la variabilidad. Dos muestras: Hay n 1 + n 2 observaciones. Hay dos medios a estimar. Eso deja a n + 1 n 2 -2 grados de libertad para la estimación de la variabilidad. Utilizó un modelo lineal con grupos g: Hay n 1 + .. + observaciones ng. Hay g significa ser estimado. Eso deja n 1 + .. + ng - g grados de libertad para la estimación de la variabilidad. Esto da cuenta de los grados de libertad del denominador para el estadístico F. La hipótesis nula primaria siendo probado por ANOVA de una vía es que los medios g de población son iguales. La hipótesis nula es que no hay un único medio. La hipótesis alternativa es que hay g individuo significa. Por lo tanto, hay g-1 --que es g (H 1) menos 1 (H 0) - grados de libertad para probar la hipótesis nula. Esto da cuenta de los grados de libertad del numerador de la razón F. Hay otra manera de ver los grados de libertad del numerador de la razón F. La hipótesis nula dice que no hay variabilidad en los medios g de población. Hay g medias muestrales. Por lo tanto, hay g-1 grados de libertad para la evaluación de la variabilidad entre los medios g. Regresión múltiple con p predictores: Hay n observaciones con p + 1 parámetros a estimar - se coeffient regresión para cada uno de los predictores más la intercepción. Esto deja np-1 grados de libertad para el error, que representa los grados de libertad del error en la tabla de ANOVA. La hipótesis nula probado en la tabla ANOVA es que todos los coeficientes de los predictores son 0. La hipótesis nula es que no hay coeficientes a estimar. La hipótesis alternativa es que hay coeficientes p a estimar. or lo tanto, hay p-0 o p grados de libertad para probar la hipótesis nula. Esto da cuenta de los grados de regresión de la libertad en la tabla de ANOVA. Hay otra manera de ver el grado de regresión de la libertad. La hipótesis nula dice que la respuesta esperada es el mismo para todos los valores de los predictores. Por lo tanto no es un parámetro para estimar - la respuesta común. La hipótesis alternativa especifica un modelo con coeficientes de regresión p + 1 parameters-- p además de una intercepción. Por lo tanto, hay p --que es p + 1 (H 1) menos 1 (H 0) - grados de regresión de la libertad para probar la hipótesis nula. Bien, así que ¿dónde está la forma cuadrática? Echemos un vistazo a la varianza de una sola muestra. Si y es una n por 1 vector de observaciones, a continuación, El número de grados de libertad es igual al rango de la n por la matriz n M. que es n-1. [regresar a El Pequeño Manual de Prácticas de Estadística]