RESUMEN: El propósito del presente artícule es evaluer en qué sentido y bajo qué condiciones la ergodicidad es relevante para explicar el éxito de la mecánica estadística. Se objeta la posición de quienes sostienen que la ergodicidad es irrelevante para tal explicación, y se señala que las propiedades ergódicas desempeñan diferentes papeles en la mecánica estadística del equilibrio y en la descripción de la evolución hacia el equilibrio: es posible prescindir de la ergodicidad en el primer caso pero no en el segundo. Sobre esta base, se reformularán las definiciones de ergodicidad y mezcla, relativizándolas a la macrovariable particular cuya evolución irreversible se desea describir. Finalmente, se enfatiza la importancia de tomar en cuenta la elaboración de modelos para evaluar la utilización de los métodos de Gibbs.
PALABRAS CLAVE: irreversibilidad, Boltzmann, Gibbs, modelos
SUMMARY: The aim of this paper is to consider in what sense and under what conditions ergodicity is relevant for explaining the success of Statistical Mechanics. We argue against those who claim that ergodicity is irrelevant to this explanation, by noting that ergodic properties play different roles in equilibrium Statistical Mechanics and in the description of the approach to equilibrium: it is possible to do without it in the first case but not in the second one. On this basis, we reformulate the definitions of ergodicity and mixing, relativizing them to the particular macrovariable whose irreversible evolution is to be described. Finally, we stress the relevance of taking into account model-construction for evaluating the use of Gibbs' methods.
KEY WORDS: irreversibility, Boltzmann, Gibbs, models
1. Introducción
Aún hoy, la mecánica estadística continua generando profundos debates respecte de sus fundamentos teóricos. En este ámbito, uno de los problemas centrales consiste en justificar la introducción de probabilidades en un contexte clásico determinista. Precisamente para dar respuesta a este problema, Ludwig Boltzmann introdujo en 1871 la llamada "hipótesis ergódica", según la cual un sistema aislado recorre, en su evolución, todos los estados compatibles con su energia: en un sistema ergódico, cualquier punto representativo de su estado en el espacio de las fases pasa, a lo largo del tiempo, por todos los puntos de la hipersuperficie de energía constante. La idea es que, dado que en un sistema ergódico el punto representativo no queda "atrapado" en ninguna subregión de la hipersuperficie de energía constante sino que recorre toda su extensión, todos los puntos de dicha hipersuperficie son igualmente probables. De este modo, Boltzmann intentaba brindar una justificación dinámica de la equiprobabilidad sobre la región del espacio de las fases accesible al sistema.
Hoy se sabe que, por consideraciones dimensionales, la hipótesis ergódica en su formulación original no puede ser verdadera: dado que cualquier trayectoria en el espacio de las fases es unidimensional, no puede "cubrir" la hipersuperficie de energía constante cuya dimensión es superior a uno. No obstante, la idea implícita en el supuesto de Boltzmann puede conservarse mediante la hipótesis cuasiergódica que reemplaza la exigencia de que el punto representativo pase por todos los puntos de la hipersuperficie de energía constante por la exigencia de que pase por toda subregión de volumen finito incluida en la hipersuperficie de energía constante, y aclarando que la condición se cumple para los puntos pertenecientes a casi toda subregión de tal hipersuperficie excepto las subregiones de medida nula. De este modo se cumple que el punto representativo no permanezca atrapado en ninguna subregión de la hipersuperficie de energía constante, evitando la condición demasiado exigente de que pase por todos sus puntos a lo largo del tiempo.
En 1901, Josiah Willard Gibbs presentó un enfoque elegante y sistemático de la mecánica estadística que permitía derivar las relaciones entre variables termodinámicas a partir de las leyes dinámicas fundamentales sin introducir supuestos acerca de los detalles de las interacciones intermoleculares. Por su sencillez y elegancia, la formulación de Gibbs se convirtió con el tiempo en la herramienta teórica estándar en la mecánica estadística, cuya fecundidad en el tratamiento de problemas tipicos de este ámbito es difícilmente cuestionable; en particular, el cálculo de los valores de equilibrio de las variables macroscopicas termodinámicas como promedios sobre el ensemble representativo es una estrategia de la cual ningún físico prescinde. Además de su función teórica original, en el enfoque gibbsiano la ergodicidad adquiere un nuevo papel al intervenir en la explicación de la evolución de los sistemas hacia el equilibrio termodinámico.
En la actualidad, la teoría ergódica se ha convertido en una teoría matemática que estudia las propiedades de los sistemas dinámicos desde una perspectiva exclusivamente formal. Sus resultados han permitido volver a analizar, con herramientas teórico-formales más precisas, el papel que cumple la ergodicidad en los fundamentos de la mecánica estadística. A la luz de estos resultados, durante las ultimas décadas diverses autores comenzaron a cuestionar la relevancia explicative que se asignaba a la ergodicidad desde la perspectiva tradicional. Este artícule se inserta en este contexto de discusión; su principal objetivo consiste en esclarecer en qué sentido y bajo qué restricciones la ergodicidad cumple un papel explicativo del éxito de la mecánica estadística de Gibbs. Para ello será necesario comenzar recordando los aspectos teóricos sobre los cuales se fundamenta la formulación gibbsiana pues, en algunos casos, el olvido de ciertas cuestiones básicas conduce a problemas conceptuales aparentemente irresolubles.
2 . Mecánica y termodinámica
La mecánica estadística surge cuando se intenta explicar la termodinámica macroscópica en términos mecánicos microscópicos, bajo el supuesto de que las regularidades macroscópicas son resultado de las regularidades que rigen los componentes microscópicos de un sistema. Por Io tanto, cuando en este contexto se habla del sistema termodinámico y del sistema mecánico, no se alude a dos entidades independientes; por el contrario, se trata de un único sistema bajo diferentes descripciones: como un sistema termodinámico S^sup T^ o como un sistema mecánico S^sup M^. A fin de simplificar la discusion, me concentraré en sistemas aislados, esto es, sistemas que no intercambian materia ni energía con el medio.
2.1. Descripción mecánica
2.2. Descripción termodinámica
Sea S^sup T^ un sistema termodinámico aislado; por lo tanto, su energía termodinámica U se mantiene constante con el tiempo. El estado termodinámico M(t) de S^sup T^ en el instante t queda definido por un conjunto de variables termodinámicas, entre las cuales pueden distinguirse dos grupos:
* Las variables C^sub i^ consideradas independientes en tanto contrôlables experimentalmente: su valor es fijado externamente con independencia de la situación particular en la que se encuentra S^sup T^. Tales variables, que funcionan como parámetros, se denominan vínculos [constraints]: un ejemplo típico es el volumen de un sistema confinado en un recipiente rígido.
* Las variables dependientes F^sub i^, cuyo valor se ajusta al de las primeras según ciertas relaciones termodinámicas conocidas. Ejemplos de tales variables son la presión y la densidad de un sistema.
Empíricamente se observa que cualquier sistema termodinámico aislado S^sup T^ inicialmente fuera del equilibrio, evoluciona irreversiblemente hacia el equilibrio: las variables termodinámicas F^sub i^(t) varían su valor con el transcurso del tiempo hasta alcanzar su valor de equilibrio F^sub ieq^, y a partir de allí mantienen su valor constante; nunca se observa la evolución inversa. En termodinámica se cuenta con distintas ecuaciones dinámicas no t-invariantes2 (por ejemplo, la ley de Fourier de difusión del calor o la ley de Pick de difusión de materia) que describen la variación temporal irreversible del valor de las variables termodináraicas F^sub i^(t).
2.3. Conexión de ambas descripciones
Bajo el supuesto de que ambas descripciones refieren a un único sistema, se impone el intente de relacionar de algún modo las variables termodinámicas macroscópicas de S^sup T^ con las variables mecánicas microscópicas de S^sup M^, de modo tal que las evoluciones temporales de las F^sub i^ así como las relaciones entre ellas puedan explicarse en términos de las q^sub i^ y p^sub i^ y sus evoluciones temporales.
Aquí es importante recordar que si bien contamos con dos descripciones de un mismo sistema, sólo tenemos acceso empírico directo a las variables macroscópicas, cuyo valor puede determinarse por medición sobre el sistema (o calcularse de modo directo a partir de variables directamente medibles). Por el contrario, las variables microscópicas no pueden ser medidas debido al carácter inobservable de los subsistemas componentes; a ello se agrega el elevado número de grados de libertad del sistema -bajo su descripción S^sup M^- en la mayor parte de los casos de aplicación. Por lo tanto, sólo nos resta construir un modelo mecánico del sistema: se postula cierta estructura del sistema, así como las características de los subsistemas componentes. La relación que se establezca entre el piano macroscópico y el microscópico será, entonces, una relación entre la descripción macroscópica S^sup T^ del sistema y la descripción microscópica S^sup M^ de un modelo mecánico de dicho sistema (volveremos sobre este punto en la sección 8).
El primer paso para conectar ambas descripciones consiste en comprobar que ciertas variables termodinámicas pueden identificarse sin inconvenientes con variables definidas en el plano mecánico. Por ejemplo, el volumen del sistema termodinámico S^sup T^ puede asimilarse al volumen dentro del cual queda confinado el movimiento mecánico de los subsistemas componentes del sistema mecánico S^sup M^. Sin embargo, en otros casos la relación no es tan directa: es necesario postular una asociación físicamente significativa entre las variables termodinámicas y las variables mecánicas. Un ejemplo sencillo es el de la energía en un sistema aislado: dado que no existe intercambio de energía con el entorno, la energía termodinámica de S^sup T^ puede asimilarse a la energía mecánica de S^sup M^ -energía cinética de movimiento más energía potencial de interacción. Otro ejemplo es el de la presión: si se considera el sistema bajo un modelo mecánico de partículas que colisionan con las paredes del recipiente que las contiene, la presión termodinámica de S^sup T^ puede asociarse con la velocidad de transferencia de momento cinético a las paredes del recipiente por unidad de área y unidad de tiempo, debida al choque de las partículas de S^sup M^. En general, se supone que el valor de las variables termodinámicas F^sub i^ queda unívocamente determinado por el microestado mecánico del sistema; por lo tanto, a cada F^sub i^ de S^sup T^ (con excepción de la temperatura absoluta y la entropía) se asocia una función del estado mecánico de S^sup M^. En otras palabras, para cada F^sub i^ se define sobre el espacio de las fases Γ una función de fase [phase function] f^sub i^: Γ [arrow right] R tal que asigne a cada punto de Γ el valor de F^sub i^ correspondiente. Dada su definición, f(x) es una función de muchos-a-uno, pues toma el mismo valor para muchos microestados diferentes, esto es, para muchos puntos del espacio de las fases.
A fin de aclarar los conceptos, concentraremos la atención en un ejemplo físico particular. Sea un gas confinado en la mitad izquierda de un recipiente rectangular de paredes perfectamente aislantes. Empíricamente se observa que, al retirar el tabique divisor entre las dos mitades, el gas comienza a difundirse de modo tal que, luego de cierto intervalo -tiempo de relajación del sistema- acaba distribuyéndose en todo el volumen accesible y en esta situación permanece; nunca se observa la evolución inversa -el gas concentrándose espontáneamente en la mitad izquierda del recipiente.
En la situaciín particular planteada, al retirarse el tabique divisor entre las dos mitades del recipiente, el movimiento mecánico de las partículas, inicialmente restringido a un volumen V^sub M1^, pasa a encontrarse restringido a un volumen V^sub M2^ > V^sub M1^. Aquí, el volumen V^sub T^ del gas puede identificarse con el volumen V^sub M^ en el que se encuentra confinado el movimiento mecánico de las particulas (V^sub T^ = V^sub M^ = V). Dado que el sistema se encuentra perfectamente aislado, la energía termodinámica U puede asociarse con la energía mecánica total E^sub M^ (U = E^sub M^ = E). A su vez, bajo el modelo mecánico dado, la densidad δ del gas en la mitad izquierda del recipiente en cada instante puede asociarse a la masa total por unidad de volumen en dicha mitad, n(t)m/(V/2), donde n(t) es el número de partículas que se encuentran en la mitad izquierda del recipiente en el instante t. Dado que n(t) queda unívocamente determinado por el microestado del sistema, puede definirse una función de fase f^sub δ^(x} que adjudica a cada punto del espacio de las fases el valor correspondiente de δ.
3 . El enfoque de Gibbs
Sin embargo, tal situación no es posible. Los sistemas del ensemble inicial evolucionan según las leyes de la mecánica cumpliendo el teorema de Liouville de constancia de la medida en el espacio de las fases: la región Γ^sub EC0^ podrá deformarse y extenderse en la nueva región accesible del espacio de las fases pero, al mantener su volumen constante, no podrá cubrir de un modo efectivo la región Γ^sub EC1^ correspondiente al nuevo estado de equilibrio. En consecuencia, dada la validez del teorema de Liouville, la entropía S^sub G^ se mantiene constante durante toda la evolución y, por lo tanto, no puede representar la entropía termodinámica S regida por el segundo principio.
En las discusiones acerca de la relevancia de la ergodicidad en la fundamentación de la mecánica estadística suele pasarse por alto que, en el contexto gibbsiano, las propiedades ergódicas cumplen un doble papel. En primer lugar, la ergodicidad justifica la elección de un ensemble microcanónico para representar el estado de equilibrio termodinámico, donde la función de distribución ρ(x) adopta un valor constante en toda la región del espacio de las fases accesible al sistema. En segundo lugar, la ergodicidad interviene en la explicación de la evolución hacia el equilibrio: para que se produzca el aumento de la entropía de grano grueso S^sub cg^, es necesario que el sistema sea mezclador, esto es, que la región inicial se deforme a través de la evolución; pero, a su vez, esto exige que el sistema sea ergódico, puesto que la propiedad de rnezcla involucra un grado de inestabilidad superior a la ergodicidad, es decir, mezcla implica ergodicidad pero no a la inversa (cfr. Lebowitz y Penrose 1973).
4. El problema de la ergodicidad
Las discusiones acerca del papel que cumple la ergodicidad en el esquema explicativo de Gibbs suelen circunscribirse al ámbito de la mecánica estadística del equilibrio, en particular, a la justificación de la estrategia gibbsiana de asimilar el valor de equilibrio de una macrovariable con el promedio en fase de su función de fase asociada mediante el ensemble microcanónico. Tradicionalmente, tal justificación se basa en el siguiente argumento: Dado que las mediciones macroscópicas insumen cierto tiempo, la magnitud medida no es el valor instantáneo de una variable macroscópica sino su promedio temporal. El intervalo de medición puede ser considerado muy corto a escala macroscópica, pero es muy largo a escala microscópica; por lo tanto, el promedio temporal sobre un intervalo finito puede asimilarse al promedio temporal infinito. A su vez, el teorema de Birkhoff asegura que, si el sistema es ergódico, para casi todo microestado inicial x^sub 0^, el promedio temporal infinito y el promedio en fase tienen el mismo valor. La idea que subyace al teorema es que, si el sistema es ergodico y se encuentra en su macroestado de equilibrio, la microevolución recorrerá, para t [arrow right] ∞, casi todos los puntos pertenecientes a la región del espacio de las fases accesible al sistema; por lo tanto, el promedio temporal de f(x) para t [arrow right] ∞ puede igualarse a su promedio en fase. En consecuencia, el valor medido de la variable macroscópica puede aproximarse al promedio en fase de su función de fase correspondiente.
Este argumento tradicional, que suele incluirse en los textos sobre mecánica estadística, ha sido objeto de dos críticas principales:
* La cláusula "para casi todo x^sub 0^" en el teorema de Birkhoff excluye los conjuntos de medida nula. Si el sistema se encuentra en un microestado representado por un punto perteneciente a taies conjuntos, el promedio temporal no está definido y, por tanto, el teorema de Birkhoff pierde su aplicabilidad. Ya Tolman (1938, pp. 68-69) objeta el papel del teorema de Birkhoff desde un punto de vista físico, al imaginar un gas confmado en un recipiente rectangular, y compuesto por partículas que se mueven paralelamente entre sí y respecto de dos de las caras del recipiente: el punto representativo de su microestado sólo podría recorrer una parte limitada de la regi∞n del espacio de las fases accesible al sistema. En consecuencia, a lo sumo podría afirmarse que la ergodicidad explica el éxito de los métodos de Gibbs en un sentido probabilístico, en particular, con probabilidad igual a uno.
* El intervalo que requiere una medición macroscópica no sólo no es infinito, sino que no puede considerarse como tal. En efecto, observamos la evolución de los sistemas hacia el equilibrio y efectuamos mediciones de magnitudes macroscópicas fuera del equilibrio: esto sería imposible si las mediciones siempre requirieran intervalos muy superiores al tiempo de relajación del sistema.
Estas objeciones fueron ya claramente formuladas por Sklar (1973), para luego ser retomadas por otros autores (cfr. Malament y Zabell 1980; Leeds 1989; Earman y Rédei 19%). Sklar (1973, p. 209) agrega una nueva crítica cuando señala que el argumento tradicional no exige que el sistema posea un alto número de grados de libertad: un sistema de dos esferas en una caja es ergódico y, por tanto, responde al teorema de Birkhoff; sin embargo, no es un sistema al que pueda aplicarse la mecánica estadística de Gibbs. Otros autores que defienden un enfoque boltzmanniano de la mecánica estadística también manifiestan su insatisfacción frente al esquema explicative de Gibbs por motivos análogos; por ejemplo, Bricmont (1995) insiste en la imposibilidad de brindar un sentido físico a la distinción micromacro en sistemas con pocos grados de libertad.
Pero entonces, ¿por qué funcionan los métodos de Gibbs? Malament y Zabell (1980) admiten que la asimilaci∞n de intervalos finitos a un intervalo infinito resulta inaceptable; no obstante, adjudican a la ergodicidad un papel limitado pero importante en la explicación del éxito predictivo de los promedios en fase. Según estos autores, el punto que debe justificarse es que la función de distribución microcanónica realmente representa la densidad de probabilidad de encontrar el sistema bajo estudio en un microestado particular. En efecto, ρ(x) define una medida µ(A) sobre los subconjuntos A de la región Γ^sub EC^ del espacio de las fases accesible al sistema, tal que:
* es absolutamente continua, es decir, µ(A) = 0 para todos los subconjuntos A de volumen nulo sobre Γ^sub EC^.
* es invariante bajo la evolución U^sub t^, es decir, para todo subconjunto medible A, µ(A) = µ(U^sub t^A).
Malament y Zabell concentran su atención en un corolario del teorema de Birkhoff según el cual, si el sistema es ergódico, la medida µ correspondiente al ensemble microcanonico es la unica medida absolutamente continua e invariante sobre la región del espacio de las fases accesible al sistema. Sobre esta base, Malament y Zabell (1980, p. 345) concluyen que la ergodicidad brinda un importante argumento para considerar que el ensemble microcanónico efectivamente representa la probabilidad de que el sistema se encuentre en sus diferentes microestados posibles.4
Si bien altamente plausible, este argumento es criticado por Earman y Rédei (1996), quienes admiten la validez de la estrategia de Malament y Zabell pero niegan su aplicabilidad a los sistemas macroscópicos de interés. En particular, Earman y Rédei (1996, p. 69) señalan que muchos de los sistemas típicos estudiados en la mecánica estadística son no ergódicos; y aun cuando el sistema bajo estudio sea sólo "un poco" no ergódico -esto es, en una ínfime región del espacio de las fases-, el resultado de Birkhoff acerca de la unicidad de μ falla por completo y no sólo "un poco" (p. 71). De aquí, Earman y Rédei concluyen que "el uso de promedios en fase calculados sobre la medida microcanónica funciona; por lo tanto, la explicación de por qué funciona debe invocar mecanismos y propiedades no ergódicos" (Earman y Rédei 1996, p. 70).
El problema de determinar el papel que cumple la ergodicidad en la explicación del éxito de los métodos gibbsianos también fue abordado por otros autores. Por ejemplo, luego de una extensa crítica a la relevancia física del teorema de Birkhoff, Tolman (1938, pp. 63-70) abandona el argumento ergódico para justificar la equiprobabilidad y prefiere adoptar, como postulado adicional de la mecánica estadística, el principio de indiferencia, esto es, la hipótesis de iguales probabilidades a priori para regiones de igual medida en el espacio de las fases; este método "tiene la justificación a posteriori de conducir a conclusiones que concuerdan con los hechos empíricos" (Tolman 1938, p. 65). Esta estrategia de justincación adopta un carácter explícitamente pragmático en la argumentación de Sklar (1973): la distribución de los estados iniciales en las muestras de gas existentes en el mundo es tal que el esquema gibbsiano funciona mediante la medida microcanónica; "esta es una cuestión de hecho, no de ley. Estos 'hechos' explican el éxito del método de Gibbs. Dicho claramente, constituyen la única explicación legítima de tal éxito" (Sklar 1973, p. 210). Si bien Sklar no lo menciona, su estrategia parece seguir la línea metodológica adoptada originalmente por el propio Gibbs con su actitud pragmática respecte de la mecánica estadística: el valor de la teoría reside exclusivamente en su capacidad de concordar con los resultados de la termodinámica fenomenológica; sobre esta base, la introducción de probabilidades no requiere otra explicación más que la utilidad de la teoría resultante (cfr. Guttmann 1999, pp. 21-25).
La estrategia pragmática para justificar el éxito de los métodos gibbsianos prescindiendo de conceptos ergódicos puede resultar convincente en el marco de la mecánica estadística del equilibrio. Sin embargo, cuando se pasa a considerar la evolución hacia el equilibrio desde el marco teórico de Gibbs, no es tan sencillo prescindir de la ergodicidad. En equilibrio, el problema consiste en justificar un método que ha demostrado ampliamente su capacidad predictiva; si se prescinde de la hipótesis ergódica, puede adoptarse otro tipo de justificatión sin que ello atente contra el éxito de tal método. Pero en el contexto de la evolución hacia el equilibrio, éste no es el caso, pues la explicatión gibbsiana de la irreversibilidad depende esencialmente del carácter mezclador del sistema: si el sistema no es ergódico -y, por tanto, no es mezclador- el esquema teórico de Gibbs predice que no se producirá el aumento de la entropía de grano grueso asociada con la entropía macroscópica; en otras palabras, no se producirá el aumento de entropía postulado por el segundo principio. Por lo tanto, prescindir de la ergodicidad aquí no conduce simplemente, como en el caso del equilibrio, a conservar el método gibbsiano pero con una nueva justificación; en el contexto de la evolución hacia el equilibrio, prescindir de la ergodicidad equivale a rechazar la explicatión gibbsiana de la irreversibilidad, esto es, a considerar incorrecta la asociación entre la entropía macroscópica y la entropía de grano grueso S^sub cg^.
Esto explica la razón por la cual quienes adoptan, en una u otra variante, la línea teórica de Gibbs siempre subrayan la necesidad de que la microestructura del sistema posea un alto grado de inestabilidad para que se manifieste el fenómeno de la irreversibilidad. Uno de los primeros autores en señalar el papel esencial que cumple la inestabilidad dinámica para la irreversibilidad fue el físico ruso Krylov, al afirmar que "el proceso de mezcla es indispensable para que exista la relajación de los sistemas físicos, esto es, para hacer posible la existencia de una ley probabilística de la distributión de los estados que sea independiente del estado inicial y esté determinada por la formula de la fluctuación" (Krylov 1979, p. 19) .5 Pero la idea de mezcla, si bien carente por completo de definitión formal, fue ya introducida por Gibbs en el capítulo XII de su Elementary Principles in Statistical Mechanics con su famosa analogía de la gota de tinta en un vaso de agua (Gibbs 1902, pp. 144-145).6 En su ya clásico texto, Tolman retoma explícitamente la misma idea:
esta disminución [de k Σ P^sub i^ log P^sub i^] es resultado de la incapacidad de los puntos representativos del ensemble, originalmente presentes en alguna particular región pequeña pero finita δ^sub q1^... δ^sub pf^ con densidad uniforme ρ, de moverse juntos como un todo compacte sin cambiar la "forma" de la extensión que ocupan. [... ] las diferentes densidades de grano fino ρ, dentro de una celda del espacio de las fases correspondiente a un rango EaE + δE, finalmente se mezclan como para darnos una densidad de grano grueso P aproximadamente uniforme dentro de ese rango. (Tolman 1938, pp. 177-178)
Es interesante notar cómo Gibbs y Tolman, careciendo de elementos teóricos para relacionar ergodicidad y mezcla, creen posible prescindir de la ergodicidad en la situación de equilibrio para el cálculo del valor de las macrovariables como promedios en fase pero, no obstante, consideran la propiedad de mezcla como un elemento indispensable para la evolución irréversible del sistema hacia el equilibrio. Los matemáticos necesitaron más de treinta años para traducir en términos formales la intuición fisica de Gibbs; cuando finalmente lo hicieron, sus resultados iluminaron muchos aspectos relevantes para la discusión acerca del problema de la ergodicidad.
Sin embargo, también respecta de los procesos irreversibles surge el disenso cuando se intenta establecer el papel que cumple la ergodicidad. Algunos autores rechazan la explicación de Gibbs de la evolución hacia el equilibrio y prefieren adoptar la línea boltzmanniana, según la cual un sistema evoluciona desde sus macroestados menos probables hacia sus macroestados más probables. Por ejemplo, Lebowitz (1993) desacredita la entropía de Gibbs como magnitud física relevante en la medida en que permanece constante durante la evolución del sistema; segun el autor, sólo la entropía de Boltzmann -definida como una medida del número de microestados compatibles con cierto macroestado de equilibrio- captura la distinción entre las escalas microscópica y macroscópica. Desde una perspectiva similar, Bricmont (1995) sostiene que todo intento de "forzar" el aumento de la entropía de Gibbs mediante particiones de grano grueso genera la incorrecta impresión de que la irreversibilidad depende de tales particiones y, por tanto, es un fenomeno subjetivo. Según este autor, la ergodicidad no es condición ni necesaria ni suficiente para la irreversibilidad. No es condición suficiente puesto que hay sistemas ergódicos de pocos grados de libertad para los cuales no tiene sentido hablar de comportamiento irreversible. Pero la afirmación más fuerte es que la ergodicidad tampoco es condición necesaria, ya que existen evoluciones que, sin ser ergódicas, manifiestan un carácter inequivocamente irreversible. Lebowitz se refiere a los procesos irréversibles en un sentido análogo: "las caracteristicas esenciales de la evolución no dependen de propiedades dinámicas específicas, como la positividad de los exponentes de Lyapounov, la ergodicidad o la mezcla" (Lebowitz 1993, p. 32).
En resumen, si bien es posible prescindir de la ergodicidad para explicar el éxito de los métodos de Gibbs en el contexto de la mecánica estadística del equilibrio, cuando se intenta explicar la evolución hacia el equilibrio el problema queda planteado con toda claridad. Mientras desde la perspectiva gibbsiana es indispensable que el sistema sea mezclador para manifestar un comportamiento irreversible, algunos autores sostienen que la ergodicidad no es condición necesaria para la irreversibilidad e incluso afirman la existencia de sistemas dinámicos no ergódicos que describen evoluciones irreversibles hacia el equilibrio.
5. Conceptos básicos de la teoría ergódica
Para tratar el problema de la ergodicidad en términos actuales, es necesario contar con los principales conceptos y resultados que suministra la teoría ergódica en su presentatión formal.
Sea un sistema dinámico S definido por:
* El espacio de las fases Γ, compacte y metrizable.
* El flujo U^sub t^: Γ [arrow right] Γ, con t ∈ R, tal que para todo A ⊆, Γ, U^sub 0^A = A, U^sub t+s^A = U^sub s^ (U^sub t^A) y U^sub t^A = U^sup -1^^sub -t^ A.
* La medida μ sobre Γ, normalizada e invariante bajo el flujo U^sub t^, y tal que para todo A ⊆ Γ, μ(U^sub t^A) = μ(A). para todo t.
Def. 1: El sistema S es ergódico su para todo A ⊆ Γ tal que μ(A) ≠ θ y para casi todo x ∈ Γ (excepto para conjuntos de medida nula), se cumple {U^sub t^x} ∩ A ≠ θ para algun t.
Def. 2: El sistema S es descomponible su Γ puede particionarse en dos o más regiones invariantes de medida no nula; por ejemplo, existen A, B C ⊂ Γ tales que A∩B = θ, A∪B = Γ, μ(A) ≠ θ, μ(B) ≠ θ y, para todo t, U^sub t^A ⊆ A y U^sub t^B ⊆ B.
Teorema 1: El sistema S es ergódico su es no descomponible.
Def. 3: Sea el sistema S y sea f : Γ [arrow right] R una función de fase integrable:
- el promedio en fase de f se define: <f>^sub p^ = ∫^sub Γ^ f(x) μ (x)dΓ
- el promedio temporal de f se define: <f>^sub t^ = lim T^sub [arrow right]∞^ 1/T ∫^sup t0+T^^sub t0^ f(U^sub t^x)dt
Teorema 2 (teorema de Birkhoff): Sea el sistema 5 y f (x) una función de fase integrable sobre Γ:
* Para casi todo x ∈ Γ (excepto para conjuntos de medida nula), el promedio temporal de f, <f>^sub t^, existe y es independiente del instante inicial t^sub 0^.
* Si el sistema S es ergódico, para casi todo x ∈ Γ (excepto para conjuntos de medida nula) se cumple que <f>^sub p^=<f>^sub t^.
Def. 4: El sistema S es mezclador su, para todo A, B ⊆ Γ, se cumple que lim^sub |t|[arrow right]∞^μ(U^sub t^A ∩ B) = μ(A)μ(B).
Teorema 3: Sea el sistema S, f(x) una función de fase integrable sobre Γ y ρ una medida absolutamente continua respecto de μ (esto es, para todo A ⊆ Γ,μ(A) = 0 [implies] ρ(A) = 0). Se define ρ^sub t^(A) = ρ(U^sub t^A). Si el sistema es mezclador, ρ^sub t^ converge a μ (ρ^sub t^ [arrow right] μ) para |t| [arrow right] ∞ en el sentido de que se cumple:
lima^sub |t|[arrow right]∞^ ∫Γ f(x)ρ^sub t^(x)dΓ = ∫Γ f(x)μ(x)dΓ
6. ¿Sistemas no ergodicos?
¿En qué tipo de sistema piensan los autores que, como Earman y Rédei, afirman que los sistemas típicos estudiados en mecánica estadística son no ergódicos? TaI vez un ejemplo de este tipo de sistema sea el caso de un gas cuyo modelo mecánico consiste en un conjunto de partículas puntuales que no colisionan entre sí, pero que Io hacen elásticamente con las paredes del recipiente que las contiene.7 Si el gas se encuentra originalmente confinado en la mitad izquierda del recipiente, al retirarse el tabique divisor el valor de la densidad en dicha mitad disminuirá-salvo condiciones iniciales microscopicas excepcionales-hasta alcanzar un nuevo valor de equilibrio. No obstante, el sistema no es ergódico: dado que las partículas no colisionan entre sí, mantienen invariante el módulo de su velocidad; por Io tanto, no todas las regiones pertenecientes a la región Γ^sub EC^ accesible al sistema son recorridas por el punto representativo.
Sin embargo, en este caso la pregunta clave es: ¿esta forma de no ergodicidad es relevante respecto de la densidad? Para que la densidad en la mitad izquierda del recipiente disminuya hasta su valor de equilibrio sólo es relevante la posición de las partículas: la velocidad que posean las partículas en cada instante no influye en el valor de la densidad en dicho instante. Desde el punto de vista gibbsiano, la evolución irreversible de la densidad en la mitad izquierda del recipiente sólo exige que, a través del tiempo, el microestado del sistema adquiera -casi- todos sus posibles valores de posición. En el lenguaje del espacio de las fases, el punto representative del microestado del sistema no debe permanecer confinado en ninguna subregión de medida no nula, ya no de la región accesible Γ^sub EC^ en su totalidad, sino de una región Γ^sub p^ incluida en Γ^sub EC^ y de dimensión inferior a Γ^sub EC^ tal región Γ^sub p^ es resultado de la intersección entre Γ^sub EC^ J el hipercilindro definido por el valor constante del módulo de la velocidad de las partículas. En defmitiva, si bien el sistema no es ergódico respecto de toda la región accesible Γ^sub EC^ sí es ergódico y, por tanto, no descomponible respecto de la subregión Γ^sub p^ ⊂ Γ^sub EC^.
Si bien en el contexto restringido de la mecánica estadística del equilibrio, Barman y Rédei (1996, p. 74) se aproximan a esta idea cuando afirman que, a fin de preservar un papel explicativo para la ergodicidad, ya no es necesario referirse a ergodicidad y mezcla completas [full ergodicity, full mixing], sino a una ergodicidad "finita" y a una mezcla "finita", esto es, referidas a un conjunto fini to de observables {O^sub i^}. Los autores definen mezcla finita del siguiente modo:
Def. 5: El sistema definido por (Γ^sub E^, U^sub t^, μ) es mezclador respecto del conjunto finito de observables {O^sub i^} sii para toda medida ρ absolutamente continua respecto de μ y tomando ρ^sub t^(A) = ρ(U^sub t^A), se cumple:
lim^sub |t|[arrow right]∞^ ∫^sub ΓE^ fO^sub i^(x)ρ^sub t^(x)dΓ^sub E^ = ∫Γ fO^sub i^(x)μ(x)dΓ^sub E^
y si bien no definen ergodicidad finita, es fácil suponer que Io harían del siguiente modo:
En nuestro ejemplo, en lugar de ser completamente ergódico y mezclador, el sistema deberá ser ergódico y mezclador respecto del observable -macrovariable- 'densidad en la mitad izquierda del recipiente' para que el sistema explicative gibbsiano funcione.
En primer lugar, cabe señalar que la posición que aquí adoptan Earman y Rédei no parece consistente con su afirmación anterior, según la cual la justificación del éxito de los métodos de Gibbs debe invocar "mecanismos y propiedades no ergódicos" (19%, p. 70): salvo que la ergodicidad finita y la mezcla finita sean consideradas "propiedades no ergódicas", no puede negarse que, aun desde esta perspectiva, ergodicidad y mezcla siguen cumpliendo un importante papel en la fundamentación de los métodos gibbsianos.
Pero un aspecto más interesante de la discusión es establecer el motivo por el cual Earman y Rédei consideran necesario introducir una diferencia conceptual entre ergodicidad y mezcla completas y ergodicidad y mezcla finitas. Los autores parecen considerar que la ergodicidad y la mezcla exigidas por el enfoque de Gibbs se refieren a toda la hipersuperficie Γ^sub E^ del espacio de las fases; a fin de ajustar esta exigencia a las definiciones generales de ergodicidad y mezcla (definiciones 1 y 3), en lugar de definir el sistema dinámico mediante su espacio de las fases Γ complete, lo hacen mediante la hipersuperficie Γ^sub E^ (definiciones 5 y 6). Con ello, las definiciones de ergodicidad y mezcla completas (definiciones 1 y 3) como de ergodicidad y mezcla finitas (definiciones 5 y 6) se refieren al sistema dinámico S = (Γ^sub E^, U^sub t^, μ), donde μ se define sobre Γ^sub E^. Si bien esta estrategia no es objetable matemáticamente, desde un punto de vista físico parece bastante artificial: en el caso de nuestro sistema de partículas que no interactúan entre sí, al cambiar su energía total no nos encontraríamos ante el mismo sistema con diferente energía, sino ante un sistema diferente. La artificialidad de este enfoque se manifiesta claramente si se aplica al sencillo sistema de una única partícula libre en movimiento acelerado: en tanto su velocidad varía instantáneamente, su energia también se modifica, y la partícula cambiaría su identidad instante a instante.
Sin embargo, la estrategia matemática de Earman y Rédei se torna más difícilmente aceptable al recordar que, como fue señalado, cuando nos referimos a un sistema aislado en particular, con sus propios vínculos C^sub i^ impuestos externamente, los microestados en los que puede encontrarse el sistema no son los representados por todos los puntos pertenecientes a Γ^sub E^; por el contrario, los sistemas del ensemble microcanónico deben distribuirse uniformemente sobre los posibles microestados representados por puntos pertenecientes a Γ^sub EC^ ⊂ Γ^sub E^, donde Γ^sub EC^ es la región del espacio de las fases accesible al sistema dados su energía total y los vínculos que le son impuestos. En otras palabras, la región del espacio de las fases que resulta relevante no es toda la hipersuperficie Γ^sub E^, sino la región accesible Γ^sub EC^ ⊂ Γ^sub E^: sólo sobre ella la mezcla y, por tanto, la ergodicidad se presentan como condición necesaria para el comportamiento irreversible del sistema. Pero Γ^sub EC^ queda defmida por los vínculos impuestos externamente. Por lo tanto, si adoptáramos la estrategia de Earman y Rédei de definir el sistema mediante la región del espacio de las fases relevante en cada caso, deberíamos aceptar que toda modificación en los vínculos impuestos modifica la identidad del sistema: en nuestro ejemplo, al eliminar el tabique divisor entre las dos mitades del recipiente, no diríamos que ha cambiado el volumen accesible al movimiento de los elementos del sistema, sino que nos encontramos ante otro sistema. Pero esta decisión metodológica se enfrenta al modo en que suele considerarse la identidad de los sistemas en la práctica científica: en nuestro ejemplo, al retirar el tabique divisor, el físico no considera que se encuentra ante un nuevo sistema, sino que el mismo sistema ha cambiado su volumen al modificarse uno de los vínculos impuestos desde el exterior y, con ello, se ha modificado la región del espacio de las fases accesible al sistema. Y aún más: si se aceptara que no se preserva la identidad del sistema con la modificación de los vínculos, sería necesario justificar por qué una ley física como el segundo principio establece una relación entre estados de equilibrio entre sistemas diferentes.
Sobre la base de estos argumentos, desde un punto de vista físico parece mucho más razonable definir un sistema dinámico mediante su espacio de las fases Γ completo, cuyas características quedan determinadas por el número de grados de libertad del sistema y por las particulares coordenadas generalizadas de sus elementos componentes. A su vez, dado que la ergodicidad y la mezcla relevantes en esta discusión nunca se refieren al espacio de las fases Γ completo, resulta más adecuado relativizar la definición misma de los conceptos de ergodicidad y mezcla respecto de cierta subregion Γ^sub α^ de Γ, del siguiente modo:
Def. 7: Dado un sistema S definido por (Γ, U^sub t^), y dada una región Γ^sub α^ ⊆ Γ sobre la cual se define una medida μ, S es ergodico sobre Γ^sub α^ sii para todo A ⊆ Γ^sub α^ tal que μ(A) ≠ 0 y para casi todo x ∈ Γ^sub α^ (excepto para conjuntos de medida nula), se cumple {U^sub t^x} ∩ A ≠ 0 para algún t.
Def. 8: Dado un sistema S definido por (Γ, U^sub t^), y dada una regiαn Γ^sub α^ ⊆ Γ sobre la cual se define una medida μ, S es mezclador sobre Γ^sub α^ sii para todo A, B ⊆ Γ^sub α^ se cumple que lim^sub |t|[arrow right]∞^ μ(U^sub t^A ∩ B) = μ(A)μ(B).
Esta relativizaciαn de los conceptos de ergodicidad y mezcla, no sαlo preserva la identidad del sistema frente a modificaciones de los vínculos impuestos, sino que permite concentrar la atenciαn en la subregiαn del espacio de las fases relevante en cada situaciαn. Tal subregiαn puede quedar definida exclusivamente por los vínculos o, como en nuestro ejemplo, también por la particular relaciαn entre la macrovariable de interés y las microvariables que definen el microestado del sistema.
Desde este nuevo punto de vista es posible comprender nuestro ejemplo de la densidad en la mitad izquierda de un recipiente desde una perspectiva diferente de la propuesta por Earman y Rédei. Para estos autores, tal densidad es el observable relevante y, por tanto, es necesario definir el concepto de mezcla -y de ergodicidad- finita respecte de tal observable como un concepto diferente del de mezcla -y de ergodicidad- completa. Desde nuestra perspectiva, por el contrario, no hay aquí dos conceptos diferentes de mezcla -y de ergodicidad-, sino un único concepto que se aplica a la región del espacio de las fases relevante en cada caso; en nuestro ejemplo se trata de la región Γ^sub p^, incluida en la región accesible Γ^sub EC^ y definida por el valor del módulo de la velocidad de las partículas que componen el sistema. En otras palabras, desde el enfoque gibbsiano, la irreversibilidad exige como condición necesaria que el sistema sea mezclador -ergódico- sobre Γ^sub p^ según la definición 8 -definición 7-, donde Γ^sub α^ = Γ^sub p^.
En definitiva, en la formulación teórica de Gibbs las propiedades ergódicas del sistema -relativas a la región relevante del espacio de las fases- cumplen un importante papel en la explicación de la evolución irreversible hacia el equilibrio termodinámico en términos de la microdinámica subyacente. A su vez, dado que el sistema conserva sus propiedades ergódicas una vez alcanzado el equilibrio, la aplicabilidad del teorema de Birkhoff también adquiere su justificación. Por lo tanto, objetar la exigencia de ergodicidad para el éxito de los métodos de Gibbs señalando la existencia de sistemas típicos que no son siquiera ergódicos sobre Γ^sub E^ resulta sumamente engañoso:8 es verdad que taies sistemas no son ergódicos ni mezcladores sobre toda la hipersuperficie Γ^sub E^, pero sí lo son sobre una región más restringida del espacio de las fases, y ésta es la única condición necesaria de mezcla y ergodicidad que exige el enfoque de Gibbs.
7. Volviendo al núcleo del problema
Esta discusión acerca de las propiedades ergódicas que exige la perspectiva de Gibbs pone de manifiesto la importancia de no sucumbir a la seducción del formalismo matemático olvidando el problema físico que se intenta resolver. Earman y Rédei aceptan sin cuestionamiento la definición formal y totalmente general de mezcla que les suministra la teoría ergódica, y tratan de aplicarla a los sistemas para los cuales el enfoque de Gibbs ha mostrado su eficacia; al comprobar que taies sistemas no responden a la definición, inventan una nueva propiedad de mezcla definida a semejanza ya no de la definición general que brinda la teoría ergódica (definición 4), sino de una consecuencia de tal definición (teorema 3), consecuencia que, precisamente, asegura el éxito de la explicación gibbsiana. ¿Cómo se justifica la introducción de esta nueva propiedad? En la argumentación de los autores no parece haber otra justificación que el mero hecho de que la nueva propiedad asegura el éxito de los métodos de Gibbs. En otras palabras, si la pregunta es: "¿Por qué la mecánica estadística del equilibrio funciona?" (Earman y Rédei 1996, p. 74), una respuesta basada en una nueva propiedad cuya introducción se justifica exclusivamente en permitir que la mecánica estadística funcione resulta sospechosamente circular. Quienes consideramos que los problemas físicos exigen soluciones en términos físicos difícilmente podemos sentirnos satisfechos con tal respuesta.
Desde nuestra perspectiva, por el contrario, no es necesario definir una nueva propiedad de mezcla, sino sólo aplicar el concepto general de mezcla a una región particular del espacio de las fases. Aquí la pregunta relevante es: ¿cómo se justifica físicamente la elección de tal región? Sin duda, no apelando al éxito de la formulación gibbsiana. Para ello es necesario volver al núcleo del problema de la ergodicidad y recordar que el disenso adquiere el carácter de dificultad conceptual en el contexto de la evolución irreversible hacia el equilibrio. Por lo tanto, en primer lugar debe clarificarse el sentido preciso de los conceptos de reversibilidad e irreversibilidad que entran en juego en la discusión.
A diferencia del concepto de t-invariancia, aplicable a ecuaciones dinámicas, el concepto de reversibilidad no se aplica a ecuaciones o leyes sino a procesos. Un proceso P compuesto por la sucesión temporal de eventos a^sub 1^, a^sub 2^, . . . , a^sub n^ es reversible si tal sucesión puede presentarse en ese orden o en el orden inverso; es irreversible si tal sucesión siempre se presenta en ese orden temporal, y nunca se observa en el sentido inverso a^sub n^, . . . , a^sub 2^, a^sub 1^. Cuando los conceptos de reversibilidad e irreversibilidad se expresan de este modo, los eventos a^sub i^ son aspectos parciales de los estados de un sistema. Por ejemplo, en la mecánica, si los eventos considerados son las sucesivas posiciones de una partícula, la evolución temporal de la posición de la partícula es un proceso reversible; en la termodinámica, si los eventos considerados son las sucesivas densidades de un gas inicialmente confinado en la mitad izquierda de un recipiente a partir del momento en que se retira el tabique divisor entre las dos mitades, la evolución temporal de dicha densidad es un proceso irreversible. Es importante insistir en que los conceptos de reversibilidad e irreversibilidad no se refieren a los estados de un sistema, sino a la evolución temporal de alguna magnitud representada por una de las variables que define el estado del sistema. Esto es particularmente claro en la mecánica: si la sucesión de posiciones de una partícula en el tiempo es x^sub 1^, x^sub 2^, . . . , x^sub n^, tal sucesión puede presentarse en sentido temporal inverso, x^sub n^ , . . . , x^sub 2^, x^sub 1^; en este caso, la ocurrencia de la sucesión inversa requiere la inversión temporal de los estados mecánicos de la partícula, de modo tal que la secuencia temporalmente invertida de estados no se compone de los estados originales sino de los estados temporalmente invertidos respecte de ellos: T(e^sub n^), . . . , T(e^sub 2^), T(e^sub 1^). Por ello, el proceso del cual debería predicarse estrictamente la reversibilidad es la evolucion temporal de la posición de la partícula, y no la evolución temporal de sus estados mecánicos.
En el caso termodinámico, el proceso al cual se aplica el predicado "irreversible" es la evolución temporal hacia el equilibrio de alguna propiedad observable representada por una variable macroscópica del sistema.9 En nuestro ejemplo, el predicado irreversible se aplica al proceso generado por los sucesivos valores de la variable macroscópica 'densidad en la mitad izquierda del recipiente', valores que disminuyen progresivamente desde el instante en que se retira el tabique hasta alcanzar la situación de equilibrio. Pero cada variable dinámica macroscópica se asocia con una función de algunas de las variables microscópicas que definen el microestado del sistema, si bien no necesariamente con todas ellas; por ejemplo, si la macrovariable es la densidad, sólo son relevantes las posiciones de las partículas; pero si la macrovariable es la temperatura, las microvariables relevantes son las velocidades de las partículas. En consecuencia, en la explicación de la evolución irreversible de cierta variable macroscópica no es necesario que la propiedad de mezcla se refiera a todas las microvariables del sistema, incluidas aquellas que resultan irrelevantes respecto de la macrovariable considerada; por el contrario, sólo es necesario que el sistema sea mezclador respecto de las microvariables que intervienen en la función asociada a la macrovariable cuya evolución irreversible se pretende explicar.
El lenguaje del espacio de las fases permite expresar la misma condición en términos geométricos. Sea un sistema S aislado con su descripción macroscópica S^sup T^ y su descripción microscópica S^sup M^. Sea F(t) una variable macroscopica de S^sup T^. Sean x^sub 1^, . . . , x^sub d^ las d microvariables que definen el microestado de S^sup M^ y mediante las cuales se construye el espacio de las fases Γ de dimensión d. Supóngase que la macrovariable F se asocia con una función de las primeras k microvariables de estado: f(x^sub i^), con 1 ≤ i ≤ k y k < d. Para que el enfoque de Gibbs explique la evolución irreversible de F(t) es condición necesaria que S^sup M^ sea mezclador sobre una región Γ^sub k^ incluida en la región Γ^sub EC^ accesible al sistema, donde Γ^sub k^ es resultado de la intersección entre Γ^sub EC^ y la hipersuperficie definida por todas las combinaciones de los valores posibles de las restantes microvariables de estado x^sub j^, con k ≤ j ≤ d. Un modo tal vez más sencillo de visualizar la misma condición consiste en descomponer el espacio de las fases Γ en dos subespacios Γ^sup i^ y Γ^sup j^ construidos mediante las microvariables x^sub i^ y x^sub j^, respectivamente; para explicar la evolución irreversible de F(t) es condición necesaria que la propiedad de mezcla se cumpla sobre la región Γ^sup i^^sub EC^ accesible al sistema, ahora definida sobre el subespacio Γ^sup i^. En nuestro ejemplo, para que el esquema teórico de Gibbs explique la evolución irreversible de la densidad del gas en la mitad izquierda del recipiente es condición necesaria que la propiedad de mezcla se cumpla sobre la región Γ^sup p^^sub EC^ definida por la energía y los vínculos del sistema, pero donde Γ^sup p^^sub EC^ es una región del subespacio de posición Γ^sub p^p obtenido de descomponer el espacio de las fases Γ correspondiente al sistema.
Esta argumentación pone de manifiesto que la discusión acerca de la relevancia de las propiedades ergódicas en la teoría de Gibbs no puede perder de vista el problema físico que intenta resolver. La teoría ergódica, en cuanto formalismo matemático, brinda una excelente herramienta para precisar los conceptos involucrados en el debate, pero esto no implica que pueda utilizársela de un modo indiscriminado. Como toda teoría matemática, la teoría ergódica no puede brindar por sí misma la respuesta a un problema físico: su aplicación sólo será fructifera si previamente sus términos formales se interpretan con precisión a la luz de los aspectos fócticos del fenómeno físico bajo estudio. Cuando esta precaución metodológica se pierde entre la maraña de argumentos puramente formales, fácilmente pueden extraerse conclusiones inadecuadas o, al menos, irrelevantes respecto del problema físico en cuestión.
8. El papel de los modelas
Una pregunta totalmente diferente de las formuladas en las secciones anteriores es la que se refiere a las características de los sistemas físicos reaies estudiados en la mecánica estadística en cuanto a su grado de inestabilidad: ¿cómo se aplican los resultados de la teoría ergódica en la práctica científica? Los críticos de la relevancia de la ergodicidad están en lo cierto cuando afirman que muchos sistemas estudiados en la mecánica estadística no son ergódicos y, por tanto, son descomponibles. En algunas situaciones, la descomponibilidad posee manifestaciones observacionalmente accesibles; este es el caso, por ejemplo, de una fase sólida en equilibrio con una fase líquida o, en general, de cualquier fase en equilibrio con otra. En estas situaciones, los métodos de Gibbs se aplican no sobre toda la región del espacio de las fases accesible al sistema, sino sobre cada una de las subregiones en las cuales aquélla se descompone. No obstante, en muchos casos el sistema no manifiesta observacionalmente señal alguna de descomponibilidad; ¿cómo actúa el físico cuando se enfrenta a este tipo de sistemas? La estrategia usual es aplicar, de todos modos, los métodos de Gibbs bajo el supuesto de que el sistema es ergódico y posee las propiedades ergódicas más fuertes. Sin duda, esta estrategia no asegura el éxito predictivo. Si los métodos gibbsianos funcionan, ello brindará elementos en favor del supuesto de ergodicidad. Pero, ¿qué sucede cuando las predicciones no se confirman empíricamente? En este caso, la reacción del físico no sera abandonar drásticamente el enfoque de Gibbs, sino buscar argumentos adicionales en favor de la descomponibilidad del espacio de las fases en subregiones donde los métodos de Gibbs sigan siendo aplicables. Como señala Quay:
un ejemplo clásico de este tipo de fracaso de la mecánica estadística se encuentra en los primeros tratamientos del H^sub 2^ puro. Como resultado de las marcadas diferencias entre la teoría y los resultados experimentales, se encontró que el espacio de las fases del H^sub 2^ debía dividirse en dos subespacios correspondientes al orto y al para hidrógeno. (Quay 1978, p. 54)
Estas consideraciones nos conducen a recordar un aspecto que frecuentemente se pasa por alto en las discusiones en torno a los fundamentos de la mecánica estadística. Cuando se intenta conectar la descripción mecánica 5 y la descripción termodinámica S^sup T^ de un mismo sistema, sólo se tiene acceso empírico directo a las variables macroscópicas correspondientes a S^sup T^. Por el contrario, la descripción mecánica S^sup M^ refiere a un modelo mecánico del sistema, construido sobre la base de postular cierta estructura microscópica, así como las características de los subsistemas componentes. Por lo tanto, cuando nos enfrentamos a un sistema a cuya descripción termodinámica S^sup T^ podemos acceder empíricamente y pretendemos aplicar los métodos de Gibbs, debemos necesariamente postular un modelo mecánico microscópico al cual referirá la descripción S^sup M^. La construcción del modelo depende del conocimiento previo o de conjeturas acerca de la microestructura del sistema.
Esta etapa descriptiva permite aplicar los métodos de Gibbs, pero aún no asegura su éxito predictivo: bien puede suceder que no se obtengan resultados satisfactorios. Frente a esto, la situación más favorable sería aquella en la que pudiéramos demostrar formalmente que nuestro modelo es ergódico, e incluso que posee las propiedades ergódicas más fuertes; en este caso, la estrategia más razonable consistiría en intentar reformular el modelo, tal vez haciéndolo más complejo e incluyendo factores considerados irrelevantes en el modelo original. Pero, lamentablemente, en la práctica la situación dista de ser tan sencilla: la demostración formal de que un sistema posee ciertas propiedades ergódicas es una tarea de enorme complejidad matemática, y sólo se ha logrado en casos altamente idealizados a través de procedimientos sumamente complejos. Por lo tanto, prácticamente siempre trabajamos con modelos mecánicos cuyas propiedades ergódicas no podemos demostrar. Frente a ello habría dos actitudes posibles. Si, atendiendo a las críticas, prescindiéramos por completo del supuesto de ergodicidad, deberíamos renunciar a utilizar una poderosa herramienta teórica como la gibbsiana para explicar las propiedades y, principalmente, el comportamiento dinámico del sistema macroscópico en su evolución hacia el equilibrio. Pero éste es un precio demasiado alto que los físicos suelen no estar dispuestos a pagar, al menos no desde el comienzo. Por ello, la estrategia más frecuente consiste en suponer que las propiedades ergódicas se cumplen y aplicar los métodos de Gibbs esperando obtener predicciones exitosas; si esto no sucede, se intenta reformular el modelo mecánico a la luz de argumentos físicos adicionales. De todos modos, esta estrategia tampoco asegura que se alcanzará una adecuación predictiva: si bien la mecánica estadística de Gibbs ha demostrado su capacidad para abordar múltiples y disímiles situaciones, hay muchos casos en los cuales aún no se ha podido aplicar exitosamente.10
Estos argumentes, referidos a la práctica científica en el contexto de la mecánica estadística, permiten afirmar que el supuesto de ergodicidad no constituye un ingrediente superflue o estéril en la teoría gibbsiana. Por el contrario, el fracaso predictive de los métodos de Gibbs bajo el supuesto de ergodicidad -no descomponibilidad- brindan información extremadamente útil acerca de la estructura microscópica del sistema, e incluso puede conducir a conjeturar ciertas propiedades inobservables de los subsistemas microscópicos componentes.
A su vez, los mismos argumentes permiten evaluar bajo una nueva luz el debate acerca del papel explicative de la ergodicidad en el marco teórico de Gibbs. En las discusiones suele enfatizarse el éxito predictivo de los métodos gibbsianos pero olvidando sus limitaciones. Si bien tal éxito es innegable, no pueden ignorarse los casos en los que los resultados no son les previstos. Las críticas al papel explicative de la ergodicidad basadas en la existencia de sistemas no ergódicos olvidan que, cuando el sistema es no descomponible, los métodos gibbsianos no son aplicables sobre toda la región del espacio de las fases accesible al sistema, sine que sólo lo son sobre cada una de las subregiones que resultan de la descomposición. Por consiguiente, la no ergodicidad de muchos sistemas de interés para la mecánica estadística no impugna el papel de las propiedades ergódicas en el marco explicativo de Gibbs. En definitiva, la exigencia de ergodicidad y de mezcla que impone el enfoque de Gibbs no asegura el carácter ergódico y mezclador de todos los sistemas relevantes en la mecánica estadística, sino sólo de aquellos donde se aplica exitosamente. Por Io tanto, mientras muchos autores formulan el problema preguntando "¿Por qué los métodos de Gibbs funcionan?", en realidad la pregunta adecuada es "¿Por qué los métodos de Gibbs funcionan cuando funcionan?", y en su respuesta las propiedades ergódicas cumplen un importante papel.
9. Conclusiones
Sin duda, los resultados formales de la teoría ergódica han permitido discutir los problemas asociados con la fundamentación de la mecánica estadística mediante argumentos mucho más precisos que los esgrimidos por los padres fundadores de la teoría. Sin embargo, en muchas discusiones taies resultados formales se aplican de un modo completamente general y no se relativizan a la luz del fenómeno físico que se pretende explicar. El poder de la herramienta matemática ha oscurecido la cuestión física.
La posición formulada en este artículo acerca del papel que cumplen las propiedades ergódicas en el esquema teórico de Gibbs cierra el camino a argumentos basados en la demostración "limpia" de teoremas generales. Nuestra perspectiva exige considerar, en cada sistema de interés, los argumentos físicos que conducen a escoger cierto modelo mecánico y los resultados predictivos que se obtienen de tal elección. Además, para cada modelo mecánico asociado al sistema bajo estudio, se impone el análisis del comportamiento de las microvariables relevantes respecto de la macrovariable cuya evolución se pretende describir. Es innegable que la incorporatión de estos aspectos conceptuales y metodológicos hace más complejos los términos del debate. Pero si olvidamos el núcleo del problema físico de la ergodicidad, corremos el riesgo de extraviarnos en discusiones puramente formales acerca de propiedades abstractas y generales que, fmalmente, los sistemas físicos suelen no poseer.
1 Dada una ecuación diferencial ordinaria de primer orden, si se cumplen las siguientes condiciones: (i) puede expresarse en su forma normal dx/dt = F(x, t); (ii) F(x, t) y dF/dx son continuas en cierto dominio D del piano Oxt; y (iii) (x^sub 0^, t^sub 0^) es un punto de tal dominio, entonces existe una soluciín única x(t) de tal ecuacion diferencial que satisface x = x^sub 0^ para t = t^sub 0^ (cfr. Piskunov 1994).
2 Una ley dinámica (ecuación) es t-invariante si es invariante ante la inversión del signo de la variable t, y de todas las variables dinámicas involucradas. El concepto de t-invariancia también puede caracterizarse en termines de las evoluciones dinámicamente posibles respecto de una ley dinámica, esto es, soluciones de la ecuación correspondiente. Una evolución -secuencia de estados- e^sub i^ [arrow right] e^sub j^ es dinámicamente posible respecto de la ley L si es consistente con L, es decir, si queda representada por una solución de L. Llamando T(e) al estado temporalmente invertido respecto de e, la ley L es t-invariante cuando se cumple lo siguiente: la evolución e^sub i^ [arrow right] e^sub j^ es dinámicamente posible respecte de L sii la evolución temporalmente invertida T(e^sub j^) [arrow right] T(e^sub i^) es también dinámicamente posible respecto de L (cfr. Savitt 1995). Sobre el concepto de irreversibilidad nos detendremos más adelante.
3 Es cierto que la mecánica estadística de Gibbs trata esencialmente de la situación de equilibrio. No obstante, ya en su Elementary Principles in Statistical Mechanics Gibbs (1902) considéra el caso de un sistema aislado en su evolución hacia el equilibrio, y su idea original la continuaron posteriormente otros autores. Como veremos más adelante, en la actualidad continúa el debate entre los defensores de un enfoque boltzmanniano y los continuadores del enfoque de Gibbs (para una comparación entre ambos enfoques, cfr. Lombardi 2000). Puesto que en este artículo no adopto una perspectiva histórica, formularé el problema en términos conceptuales tal como se presenta en nuestros dias (para detalles históricos, cfr. Brush 1976).
4 Malament y Zabell tambiên señalan la importancia de que el sistema posea un elevado número de grades de libertad para el éxito de los métodos de Gibbs. En efecto, sobre la base de un resultado de Khinchin (1949) se demuestra que, si f(x) tiene pequeña dispersión respecto de la medida µ, la probabilidad de que su promedio en fase <f>^sub p^ difiera de su promedio temporal <f>^sub t^ también será muy baja y, por tanto, será altamente probable que los métodos de Gibbs "funcionen".
5 Los trabajos de Krylov fueron originalmente publicados en la década de 1940. Una interesante discusión acerca de las tesis de este físico ruso puede encontrarse en Batterman 1990.
6 Es interesante notar que el tratamiento que hace Gibbs de la irreversibilidad en el capítulo XII parece contradecir los primeros capítulos de su obra, donde el autor asurne una actitud crítica frente al poder explicative de la ergodicidad y asume una actitud pragmática acerca de la justificación de sus propios métodos.
7 Un caso conocido de este tipo de modelo mecánico es el llamado "gas de Lorentz", compuesto de un gran número de partícules que no interactúan entre sí y que se mueven en un piano entre un arreglo periódico de dispersores [scatterers], ubicados de modo tal que una partícule no puede recorrer más que una distancia especificada entre colisiones.
8 Esta crítica a los defensores del enfoque de Boltzmann se refiere exclusivamente al problema de la ergodicidad, pero no implica una completa adhesión al enfoque gibbsiano, el cual posee sus propias limitaciones como, por ejemplo, la necesidad de justificar la utilización de ensembles para explicar el comportamiento de sistemas singulares, o el carácter gnoseológico de la entropía de Gibbs.
9 Si bien tradicionalmente el problema de la irreversibilidad suele plantearse en términos del aumento de entropía, parece mas natural hacerlo en términos de la evolución hacia el equilibrio de alguna propiedad observable del sistema, puesto que observamos como la densidad de un gas se vuelve uniforme o cómo se mezclan dos fluidos, pero no observamos en forma directa el flujo de entropía.
10 Por ejemplo, los métodos gibbsianos todavía no se han podido aplicar exitosamente a fluidos de muy alta densidad.
BIBLIOGRAFÍA
Batterman, R.W., 1990, "Irreversibility and Statistical Mechanics: A New Approach?", Philosophy of Science, vol. 57, pp. 395-419.
Bricmont, J., 1995, "Science of Chaos or Chaos in Science?", Physicalia Magazine, vol. 17, pp. 159-208.
Brush, S., 1976, The Kind of Motion We Call Heat, North Holland, Amsterdam.
Earman, J. y M. Rédei, 1996, "Why Ergodic Theory Does Not Explain the Success of Equilibrium Statistical Mechanics", British Journal for the Philosophy of Science, vol. 47, pp. 63-78.
Gibbs, J.W., 1902, Elementary Principles in Statistical Mechanics, Yale University Press, New Haven.
Guttmann, Y.M., 1999, The Concept of Probability in Statistical Physics, Cambridge University Press, Cambridge.
Khinchin, A.I., 1949, Mathematical Foundations of Statistical Mechanics, Dover, Nueva York.
Krylov, N.S., 1979, Works on the Foundations of Statistical Physics, Princeton University Press, Princeton.
Lebowitz, J.L., 1993, "Boltzmann's Entropy and Time's Arrow", Physics Today, vol. 46, pp. 32-38.
Lebowitz, J.L. y O. Penrose, 1973, "Modern Ergodic Theory", Physics Today, vol. 26, pp. 23-29.
Leeds, S., 1989, "Malament and Zabell on Gibbs Phase Averages", Philosophy of Science, vol. 56, pp. 325-340.
Lombardi, O., 2000, "La interpretación de la irreversibilidad: Prigogine versus Gibbs", Diálogos, año XXXV, pp. 37-56.
Malament, D.B. y S.L. Zabell, 1980, "Why Gibbs Phase Averages Work -The Role of Ergodic Theory", Philosophy of Science, vol. 47, pp. 339-349.
Piskunov, N., 1994, Cálcula diferencial e integral, Limusa, México.
Quay, P.M., 1978, "A Philosophical Explanation of the Explanatory Functions of Ergodic Theory", Philosophy of Science, vol. 45, pp. 47-59.
Sklar, L., 1973, "Statistical Explanation and Ergodic Theory", Philosophy of Science, vol. 40, pp. 194-212.
Savitt, S.F., 1995, "Introduction", en S.F. Savitt (comp.), Time's Arrows Today, Cambridge University Press, Cambridge.
Tolman, R.C., 1938, The Principles of Statistical Mechanics, Clarendon Press, Oxford.
Recibido el 13 de septiembre de 2002; aprobado el 8 de enero de 2003.
You have requested "on-the-fly" machine translation of selected content from our databases. This functionality is provided solely for your convenience and is in no way intended to replace human translation. Show full disclaimer
Neither ProQuest nor its licensors make any representations or warranties with respect to the translations. The translations are automatically generated "AS IS" and "AS AVAILABLE" and are not retained in our systems. PROQUEST AND ITS LICENSORS SPECIFICALLY DISCLAIM ANY AND ALL EXPRESS OR IMPLIED WARRANTIES, INCLUDING WITHOUT LIMITATION, ANY WARRANTIES FOR AVAILABILITY, ACCURACY, TIMELINESS, COMPLETENESS, NON-INFRINGMENT, MERCHANTABILITY OR FITNESS FOR A PARTICULAR PURPOSE. Your use of the translations is subject to all use restrictions contained in your Electronic Products License Agreement and by using the translation functionality you agree to forgo any and all claims against ProQuest or its licensors for your use of the translation functionality and any output derived there from. Hide full disclaimer
Copyright UNAM Instituto de Investigaciones Filosóficas Apr 2003