See also: ICA&D KNMI Climate Explorer
 
 

FAQ

 
 

FAQ

Las respuestas a las Preguntas Frecuentes dadas a continuación intentan ser resumidas más que totalmente explicativas. Para más detalles, ver la documentación provista en Información.

 

¿Por qué el proyecto LACA&D?

¿Cuál es la diferencia entre datos públicos y no-públicos?

¿Qué datos básicos, series y estaciones se usan?

¿Por qué más de una defición para temperatura min., media & max., etc.?

¿Qué significa rellenar y actualizar?

¿Por qué LACA no usa los códigos de estaciones OMM como identificador?

¿Qué procedimientos de control de calidad y homogeneidad se aplican?

¿Por qué existen valores ligeramente diferentes del archivo que descargué anteriormente?

¿Cómo obtener datos diarios que no están disponibles para el público en este sitio web?

¿Cómo se calculan las líneas suavizadas en los gráficos de índices?

¿Qué procedimiento se utiliza para calcular las tendencias?

¿Por qué algunas estaciones no aparecen en el mapa de tendencias, sin embargo el gráfico de la serie de tiempo está disponible?

¿Por qué algunos valores difieren de aquellos que obtuve del Servicio Meteorológico Nacional?

 

 

¿Por qué el proyecto LACA&D?

El objetivo de LACA&D es combinar series de observaciones diarias de estaciones meteorológicas, control de calidad, análisis de extremos y la diseminación tanto de los datos diarios como de los resultados de los análisis. La integración de estas actividades en un proyecto se demuestra que es escencial para el éxito. Nuevas actualizaciones del grupo de datos diarios serán publicadas a intervalos regulares. [arriba]

 

Cuál es la diferencia entre los datos públicos y no público?

Parte de los datos en LACA&D es para las estaciones que están etiquetados como 'non-public'. Esto indica que los datos diarios de estas estaciones no están disponibles al público desde este sitio web. Los datos diarios 'Non-public' se utilizan junto con los datos diarios 'public' para calcular productos con valor agregado, como los índices de extremos. Los productos derivados están a disposición del público, independientemente del estado 'non-public'/'public' de los datos diarios en los que se basan estos productos. Vea nuestra data policy para más detalles. [arriba]

 

¿Qué datos básicos, series y estaciones se usan?

El grupo de datos de la base LACA dataset consiste en series de estaciones diarias obtenidas de las divisiones de climatología de los Servicos Meteorológicos e Hidrológicos Nacionales y series de estaciones mantenidas por observatorios y centros de investigación a lo largo de Latino América. Para detalles de los proveedores individuales vea la lista de participantes. Un sumario de todos los datos disponibles se provee en el diccionario de datos.

Las series han sido sometidas a control de calidad y se ha agregado un marca (“OK (bueno)”, “suspect (sospechoso)” or “missing (perdido)”) a los datos individuales. Las pruebas de Homogeneidad resultan en una clasificación de la serie en “useful (útil)”, “doubtful (dudosa)” or “suspect (sospechosa)”. Tome en consideración que estas categorías son válidas para el intervalo de tiempo en particular para el que la prueba fue aplicada. Se recomienda utilizar los resultados de las pruebas de homogeneidad para seleccionar las series e intervalos de tiempo apropiados. Las series no han sido homogeneizadas en el sentido que los datos han sido cambiados. [arriba]

 

¿Por qué más de una defición para temperatura min., media & max., etc.?

Diferentes países estiman promedios diarios de temperatura utilizando diferentes métodos y fórmulas. También, los intervalos para la observación de temperatura mínima y máxima difiere, lo mismo que el intervalo de tiempo para medir la precipitación acumulada de 24h. Cada serie es entonces etiquetada con el element id apropiado.[arriba]

 

¿Qué significa rellenar y actualizar?

Las series recibidas por los países participantes generalmente no contienen datos para los años recientes. Esto se debe parcialmente al tiepo que se necesita para el control de calidad de los datosy el almacenamiento en las instituciones de los particpantes y por otro lado a los esfuerzos que se necesitan para incluir los datos en la base LACA. Para lograr que esté disponibles una serie lo más completa posible para una estación, hemos incluido un proceso automático de actualizaci&oacte;n que depende de los datos diarios de los mensajes SYNOP que son distribuidos en tiempo casi real por el Global Telecommunication System (GTS). En este procedimiento, los espacios vacíos en una serie diaria son también rellenados con observaciones de estaciones cercanas, con el criterio que se encuentren a menos de 25km de distancia y que la diferencia de altura sea menor a 50m.

Las obciones de descarga bajo datos diarios permite seleccionar Rellenar y actualizar = Si o No. En caso que se elija una serie rellena, se provee información de las series utilizadas en el proceso de relleno.

Observe que no solo las series rellenas son posteriormente analizadas en en LACA&D. [arriba]

 

¿Por qué LACA no usa los códigos de estaciones OMM como identificador?

Los números de estaciones OMM no se utilizan como un identificador único para la serie de datos diarios LACA, porque no todas las estaciones con datos cuentan con un número de estación OMM asignado. [arriba]

 

¿Qué procedimientos de control de calidad y homogeneidad se aplican?

Series de la mejor calidad posible son provistas por las instituciones participantes de LACA&D. Adicionalmente, se aplican procedimientos comunes de control de calidad a todas las series utilizando varios algoritmos (ver Información > ATBD). estos procedimientos de control de calidad genran marcas (“OK (bueno)”, “suspect (sospechoso)” o “missing (perdido)”) asignadas a cada dato individual.

Aunque la validación haya sido cuidadosa, no se puede excluir que ciertos errores permanezcan sin detectar. El riesgo para estos errores es mayor en los datos recientes obtenidos de estaciones sinópticas porque estos datos no han sido sometidos a un proceso de validación en las instituciones participantes.

Aparte de errores en días individuales, ciertos cambios en las prácticas de observación pueden haber introducido in-homogeneidades de origen no-climático en series de tiempo largas. estas inhomogeneidades pueden afectar severamente la estimación de cambios en los extremos. Para la evaluación de la homogeneidad de las series de tiempo en LACA&D se sigue un procedimiento de dos pasos (ver Información > ATBD). Primero, se aplican cuatro pruebas de homogeneidad comunes para evaluar las series diarias en períodos de tiempo fijos utilizando las siguientes variables de prueba: (1) la media anual del rango diurno de temperatura DTR ( = temperatura máxima - temperatura mínima), (2) la media anual de la diferencia absoluta día a día del rango diurno de temperatura vDTR y (3) el contaje de días húmedos RR1 (umbral 1 mm). Segundo, los resultados de las pruebas se condensan para cada una de las series en tres clases: useful (útil)-doubtful (dudoso)-suspect (sospechoso). Las cuatro pruebas comunes de hogeneidad son: prueba de Homogeneidad Normal Estándar, prueba de BuisHand Range, prueba PETtitt, y prueba von NEUmann ratio.

Observe que el análisis de homogeneidad de arriba está sujeto a futura investigación, debido a que no están claramente establecidos procedimientos de pruebas para datos diarios. También, una pregunta abierta es cómo aplicar los resultados de las pruebas. Esto es dependiente de la aplicación en particular. Para los índices de extremos analizados en LACA&D hemos escogido presentar resultados de tendencias solo para aquellas series que son útiles o dudosas, pero en otros casos se pueden escoger otras opciones (ver la sección de publicaciones). Hay una clara necesidad de investigación adicional en técnicas de homogeneización de datos diarios para crear series de datos de alta calidad para la evaluación de extremos sin dejar de lado series enteras o descartando verdaderos extremos. Esto es de particular importancia en áreas donde la densidad de estaciones con series largas de datos diarios es baja. [arriba]

 

¿Por qué existen valores ligeramente diferentes del archivo que descargué anteriormente?

Todos los archivos en este sitio web son frecuentemente actualizados para inlcuir las últimas actualizaciones disponibles. La actualización no solo incluye los más recientes datos sino también la inclusión de cualquier reporte de fechas anteriores. Adicionalmente, las series más antiguas pueden haber cambiado, porque ha existido una mejora en el control de calidad o arqueología de datos por parte de las instituciones proveedoras de datos. [arriba]

 

¿Cómo obtener datos diarios que no están disponibles para el público en este sitio web?

El sitio web LACA&D pone a disposición todas las series de datos diarios para los cuales las condiciones de uso permiten su publicación. Para algunas estaciones, solo está permitido el uso de datos diarios para el análisis de extremos dentro del proyecto LACA&D, sin que los datos puedan ser liberados. Estas estaciones aparecen en el diccionario de datos y en la sección de índices del sitio web, así como en publicaciones, pero no aparecen en la sección de datos diarios. Por favor dirija sus peticiones para obtener estos datos diarios directamente al SMHN del respectivo país. [arriba]

 

¿Cómo se calculan las líneas suavizadas en los gráficos de índices?

La linea roja suavizada en que aperece en los gráficos es calculada usando la lowess smoother function con los parámetros: f=1/5, iter=3, usando un código Fortran open-source de wsc@research.bell-labs.com, W. S. Cleveland, Bell Laboratories, Murray Hill NJ 07974.

Referencias:
Cleveland, W.S. (1979). Robust locally weighted regression and smoothing scatterplots. J.Amer.Statist.Assoc., 74, 829-836.
Cleveland, W.S. (1981). LOWESS: A program for smoothing scatterplots by robust locally weighted regression. The American Statistician, 35, 54. [arriba]

 

¿Qué procedimiento se utiliza para calcular las tendencias?

Las tendencias se calculan mediante un ajuste lineal óptimo de mínimos cuadrados utilizando una rutina NAG's E02ADF.

Referencias:
Numerical Algorithms Group website: http://www.nag.co.uk/numeric/FL/manual/html/FLlibrarymanual.asp
references in the NAG Fortran Library Routine Document E02ADF [arriba]

 

¿Por qué algunas estaciones no aparecen en el mapa de tendencias, sin embargo el gráfico de la serie de tiempo está disponible??

Para que una tendencia se calcule, la estación debe tener datos válidos de índices por al menos el 80% del período para el cual la tendencia fue calculada. Por ejemplo, para un período de 1901-1999 (99 años), al menos 80 años deben tener datos válidos. Adicionalmente, el resultado de la prueba de homogeneidad de la serie debe ser 'useful' o 'doubtful' para ese período. Si el resultado de la prueba es 'suspect' o menos del 80% del período de la tendencia tiene datos válidos, la tendencia para esa estación no es calculada y por consiguiente no es graficada en los mapas de tendencias. Un gráfico de serie de tiempo se genera si cualquier dato válido de índice está disponible para esa estación en particular, con la única restricción de que los valores de índices para un año en particular se calculan sólo si no existe más del 3% de días faltantes. [arriba]

 

¿Por qué algunos valores difieren de aquellos que obtuve del Servicio Meteorológico Nacional?

LACA utiliza dos clases de fuentes de datos: datos medidos por el Servicio Meteorológico Nacional u otros participantes (los llamados aquí, datos de participantes) y los datos de mensajes sinópticos. Las diferencias entre estas dos clases de datos es que por lo general los datos de participantes son validados, mientras que los datos sinópticos no son validados. En LACA&D los mensajes sinópticos se utilizan temporalmente para extendender series de datos  para hacer la serie lo más actual posible. En cuanto los datos de participantes esten disponibles, los datos sinópticos son reemplazados.

Datos sinópticos no-validados se pueden distinguir de datos validados de participantes por la primera figura del source ID (SOUID) dado que en cada archivo de datos: una fuente que empiece con 9 representa datos sinopticos no-validados, mietras que una fuente que empieza con 1 representa dato de participante validado. [arriba]