GARP

  1. Que hace GARP y como. Que calcula.
GARP (Genetic Algorithm for Rule Production) es un algoritmo genetico que encuentra regiones del mapa que son similares a las de los puntos de entrenamiento. Funciona poniendo a "competir"  algoritmos radicalmente diferentes (dos versiones de una caja bioclimatica, una regresion log-linear, que usa como ceros datos del background, las llamadas "reglas atómicas" y en algunas versiones, un metodo de clasificacion llamado e-balls) para clasificar las presencias (observadas) y las ausencias (inventadas con las muestras del background). El resultado es una combinacion de reglas logicas que describen diferentes combinaciones de los  algoritmos que replican mas correctamente las presencias y las seudoausencias. El metodo balancea de manera diferente los errores de omision (clasificar como ausencias los datos de presencias) y los de comision (clasificar como presencias datos del background). Los errores de omision son mucho mas graves en SDM/ENM que los de comision, por lo que distinguirlos es una de las cualidades mas importantes de GARP.
 
GARP genera soluciones estocasticamente por lo que es indispensable correr al menos unas n > 100 simulaciones por conjunto de datos para luego superponerlas y obtener un numero entero (entre 0 y n) que describe el grado de consenso del algoritmo para identficar regiones similares a las de las ocurrencias y disimilares al "background". El resultado de n corridas de GARP se puede usar para mapear y desplegar la prediccion sobre que tan similares son las zonas de la region de referencia a aquellas donde la especie fue observada. GARP no da "probabilidades" de ningun tipo, sino un indice de que tan favorables son los ambientes a los requerimientos de la especie.

 2Parametros y defaults.  Se recomienda:
  1. Se debe usar la configuracion de "rule types" como aparece por default.
  2. No modificar el parametro de "At least 20 training points"
  3. El porcentaje de puntos utilizados para "model training" puede ser mas alto si se tienen muy pocas ocurrencias. Con menos de 15 puntos, por ejemplo, es preferible usar el 100% para training
  4. Number of runs entre 100 y mil.
  5. Se puede bajar el "convergence limit" a 0.001 para entrenar modelos mas ajustados a los datos.
  6. El balance entre omision y comision se explica en el documento anexo.
  7. En la ventana de "how layers will be used" usar para explora el papel de las variables las opciones "All combinations of selected layers"

3. FCF = Frequently Committed Fuck-ups.  
  1. Hacer una sola corrida de GARP.
  2. No entender como funcionan los "best subsets" (consultar Anderson Lew, Peterson 2002)
  3. Incluir datos categoricos

 4. Recomendaciones

  1. Obtener de 100 a mil replicas.
  2. Explorar diferentes configuraciones de "best subsets"


Abajo se anexa una descripcion detallada de la forma de usar GARP escrita por A. T. Peterson


Ċ
Jorge Soberon,
15 jul. 2011 16:21