Página precedente Indice Página siguiente


2.  ESTADISTICAS: REGRESION Y CORRELACION

Introducción

La tarea llevada a cabo por los biólogos pesqueros generalmente requiere una considerable cantidad de análisis estadísticos; y en consecuencia la mayoría de los cursos de biología pesquera incluyen estadística elemental, por lo menos.

Lo más frecuente, sin embargo, es que la falta de práctica determine que se olvide lo aprendido, lo cual implica que una muy valiosa herramienta de trabajo permanezca poco utilizada.

Este capítulo pretende revisar brevemente dos técnicas estadísticas de gran importancia - análisis de regresión y de correlación - así como indicar algunos de sus más comunes campos de aplicación por parte de los biólogos pesqueros.

Regresión lineal

Expresándolo en forma simple, la regresión lineal es una técnica que permite cuantificar la relación que puede ser observada cuando se grafica un diagrama de puntos dispersos correspondientes a dos variables, cuya tendencia general es rectilínea (Figura la); relación que cabe compendiar mediante una ecuación “del mejor ajuste” de la forma:

y = a + bx
(1)

En esta ecuación, “y” representa los valores de la coordenada a lo largo del eje vertical en el gráfico (ordenada); en tanto que “x” indica la magnitud de la coordenada sobre el eje horizontal (absisa). El valor de “a” (que puede ser negativo, positivo o igual a cero) es llamado el intercepto; en tanto que el valor de “b” (el cual puede ser negativo o positivo) se denomina la pendiente o coeficiente de regresión.

Tabla 1

Serie de datos para el cálculo de una regresión (“a” y “b”) y del coeficiente de correlación (“r”)

NúmeroValores de xValores de yNúmeroValores de xValores de y
1
9,0
0,50
 7
6,7
1,00
2
9,4
0,50
 8
8,4
0,50
3
7,4
1,23
 9
8,0
0,50
4
9,7
1,00
10
10,0
0,50
5
10,4
0,30
11
9,2
0,50
6
5,0
1,50
12
6,2
1,00
 13
7,7
0,50

El procedimiento para obtener valores de “a” y “b” para una serie de pares de datos de “x” y de “y” (tal como la presentada en la Figura 1 y/o en la Tabla 1) es como sigue:

Paso 1Calcule, para cada par de valores de “x” e “y”, las cantidades “x²”, “y²”, y “x.y”.
Paso 2Obtenga las sumas (∑) de estos valores para todos los pares de datos de “x” e “y”, así como las sumas del total de los valores de “x” e “y”. Los resultados de los Pasos 1 y 2 aparecerán en forma similar a la siguiente:
Número de pares de datosxyx.y
1
2
3
·     
·     
·     
n
Monto de las sumas∑x∑x²∑y∑y²∑x·y
Paso 3Estime la pendiente (b) por medio de la relación:
 
Paso 4Estime el intercepto (a) por medio de la relación:
 

A partir de esos valores de “a” y de “b” obtenidos mediante las Ecuaciones 2 y 3, es posible trazar a lo largo de los puntos dispersos de un gráfico la línea recta mejor ajustada a los mismos, y verificar visualmente si tales puntos están bien “expresados” por la línea (Figura 1b).

Correlación

El análisis de correlación se encuentra estrechamente vinculado con el análisis de regresión y ambos pueden ser considerados de hecho como dos aspectos de un mismo problema.

La correlación entre dos variables es - otra vez puesto en los términos más simples - el grado de asociación entre las mismas. Este es expresado por un único valor llamado coeficiente de correlación (r), el cual puede tener valores que ocilan entre -1 y +1. Cuando “r” es negativo, ello significa que una variable (ya sea “x” o “y”) tiende a decrecer cuando la otra aumenta (se trata entonces de una “correlación negativa”, correspondiente a un valor negativo de “b” en el análisis de regresión). Cuando “r” es positivo, en cambio, esto significa que una variable se incrementa al hacerse mayor la otra (lo cual corresponde a un valor positivo de “b” en el análisis de regresión).

Los valores de “r” pueden calcularse fácilmente en base a una serie de pares de datos de “x” e “y”, utilizando la misma table y montos que se indican en el Paso 2 de la sección “regresión” de este capítulo. De este modo “r” puede ser obtenido - indirectamente - a partir de la relación:

Figura 1a

Figura 1a  Diagrama de puntos dispersos correspondientes a pares de valores de “x” y de “y”. Nótese que “y” tiende a decrecer con el aumento de “x”, lo cual sugiere coeficientes de regresión y de correlación negaticos (basado en la Tabla 1)

Figura 1b

Figura 1b  Los mismos datos que en 1a Fig. 1a, pero ajustados en base a la regresión y = 2,16 - 0,173x, con r = 0,75

la cual proporciona el valor del “coeficiente de determinación” (r²). Entonces, lo único necesario es calcular

es decir, tomar la raíz indicada del coeficiente de determinación a los fines de obtener el valor absoluto de “r”, y luego agregar el signo (+ o -) de acuerdo a que la correlación sea positiva o negativa (lo cual puede ser establecido visualmente a partir del gráfico, o bien en base al cálculo del valor de “b” de la correspondiente regresión y utilizando para “r” el mismo signo).

Cuando se calculan los valores de “r” se querrá saber, sin embargo, hasta qué punto la correlación identificada pudiera haber surgido únicamente por casualidad. Esto puede ser establecido verificando si el valor estimado de “r” es “significativo”, es decir si el valor absoluto de “r” es mayor o igual que un valor “crítico” de “r” indicado en las tablas estadísticas (ver Tabla de valores críticos de “r” en el Apéndice 1).

Ejercicio:  Calcule “a”, “b” y “r” a partir de los datos presentados en la Tabla 1 y verifique, por medio de la Tabla del Apéndice 1, hasta qué punto el valor estimado de “r” es significativo para valores de P = 0,01 y de P = 0,05

Transformación Lineal en el Análisis de Regresión

Como se indicara anteriormente, tanto el análisis de regresión como el de correlación se basan en la asunción de una relación “lineal” entre las dos variables de referencia (lo cual significa que la mejor línea de ajuste es una recta). Hay muchos casos en biología pesquera, sin embargo, en los cuales la relación entre ambas variables no es lineal, y un buen ejemplo de ello es la relación largo-peso, donde:

W = α · Lb
(6)

ecuación que indica que el peso (W) es proporcional a una cierta potencia (b) de la longitud (L) (ver Figura 2a).

Los datos largo-peso, sin embargo, pueden ser ajustados a una regresión lineal si se toma el logaritmo de ambos miembros, de manera que:

log10W = a + b log10L
(7)

Como puede observarse en la Figura 2b, los logaritmos de la longitud y del peso se ajustan extremadamente bien a una regresión lineal, donde:

y = log10W
(8a)

y

x = log10L
(8b)

Así, el ajuste de una relación largo-peso de la forma dada en la Ecuación (6) a una serie de datos de ambas varibales (tal como en la Tabla 2) consiste en lo siguiente:

Tabla 2

Datos para la estimación de la relación largo-peso en el “threadifin bream” Nemipterus marginatusa
NúmeroL = Longitud total (cm)W = Peso (en g) Log10L(=x)Log10(=y)
 1
8,1
6,3
0,908
0,799
 2
9,1
9,6
0,959
0,982
 3
10,2
11,6
1,009
1,064
 4
11,9
18,5
1,076
1,267
 5
12,2
26,2
1,086
1,425
 6
13,8
36,1
1,140
1,558
 7
14,8
40,1
1,170
1,603
 8
15,7
47,3
1,196
1,675
 9
16,6
65,6
1,220
1,817
10
17,7
69,4
1,248
1,841
11
18,7
76,4
1,272
1,883
12
19,0
82,5
1,279
1,916
13
20,6
106,6
1,314
2,028
14
21,9
119,8
1,340
2,078
15
22,9
169,2
1,360
2,228
16
23,5
173,3
1,371
2,239

a Del extremo sur del mar del Sur de la China. Original

Paso 1Obtenga el logaritmo de los valores de largo y peso.
Paso 2Calcule los montos indicados en la sección referente a regresión, determinando los valores de “x” e “y” tal como se indica en las Ecuaciones 8a y 8b.
Paso 3Estime “a” y “b” utilizando las Ecuaciones 2 y 3.
Paso 4Tome el antilogaritmo de “a”, a fin de obtener “α” en la Ecuación 6.
Paso 5Anote la Ecuación 6 sustituyendo los parámetros “α” y “b” por sus valores estimados
Paso 6Utilizando las magnitudes calculadas en el Paso 2, determine los valores de “r²” y “r” y verifique en la Tabla 2.
Ejercicio:
(a) Lleve a cabo los Pasos 1 al 6 (con P = 0,01) para los datos de largo-peso indicados en la Tabla 2.
 
(b) Haga un listado de otras posibles tranformaciones por linerización, e indique ejemplos de su uso en biología pesquera.

Página precedente Inicío de página Página siguiente