Jueves, 6 de Octubre de 2022

Atlantic Review of Economics 

            Revista Atlántica de Economía

Colegio de Economistas da Coruña
 INICIO > EAWP: Vols. 1 - 9 > EAWP: Volumen 4 [2005]Estadísticas/Statistics | Descargas/Downloads: 8808  | IMPRIMIR / PRINT
Volumen 4 Número 15: La Siniestralidad en el Seguro de Automóviles en Andalucía frente al resto de España. Un Análisis a través de un Modelo Count Data

María del Carmen Melgar Hiraldo
Universidad Pablo Olavide

José Antonio Ordaz Sanz
Universidad Pablo Olavide

Reference: Received 10th August 2005; Published 18th November 2005. ISSN 1579-1475

Este Working Paper se encuentra recogido en DOAJ - Directory of Open Access Journals
http://www.doaj.org/

 

Resumen

El presente trabajo analiza las principales variables que influyen en la siniestralidad en el seguro de automóviles. Al tiempo que se determinan tales variables, se pretende comprobar si existen diferencias significativas de comportamiento entre los asegurados de Andalucía y los del conjunto del resto de España. Éste es el objetivo principal de la investigación. Con este fin, se lleva a cabo un análisis econométrico que utiliza datos cedidos por una entidad aseguradora privada, sobre los que se aplica, para estimar el número de siniestros registrados, un modelo binomial negativo inflado de ceros. En nuestro estudio, las observaciones nulas de la variable endógena pueden tener distintas interpretaciones. Los modelos inflados de ceros, de la familia de los count data, permiten abordar esta cuestión. Palabras clave: siniestros, seguro de automóviles, modelo binomial negativo inflado de ceros, count data, Andalucía.


Abstract

The present paper analyzes the most relevant variables that influence the declared number of accidents in the automobile insurance sector. In the process of determination of these factors, we focus on the possible significant differences we can find on the insured drivers´ behaviour depending on the region they come from: Andalusia or the whole of the rest of the Spanish territory. This is the main objective of our research. In order to achieve this purpose, an econometric analysis is provided using a database from a private insurance company and a zero-inflated negative binomial model, that estimate the number of registered accidents. In our study, the observed zero values of the endogenous variable can have different meanings. Zero-inflated models, belonging to the count data type of models, can undertake this question.


INTRODUCCIÓN


  El seguro de automóviles es uno de los ramos más importantes del sector asegurador en España. Si se considera únicamente la vertiente no-vida, su notoriedad es aún más destacable1. Una de las principales preocupaciones de las compañías que operan en este ramo es llegar al conocimiento de las características de los conductores que influyen en una mayor siniestralidad. De esta manera, se podría predecir de algún modo el número de siniestros que se espera que tenga el asegurado y fijar así de la forma más precisa posible la prima que debe pagar cada uno.

  En los últimos años, han sido muchos los estudios sobre el seguro de automóviles que se han desarrollado en distintos países. Gran parte de ellos se centran en el estudio de los problemas de asimetría de información que son tan frecuentes en este sector asegurador. En líneas generales, tratan de determinar la presencia de riesgo moral y/o selección adversa, comprobando la correlación positiva entre el número de siniestros sufridos y el grado de cobertura del que disfruta el asegurado2. Destacan, en este sentido, los estudios de Dionne, Gouriéroux y Vanasse (1999), Richaudeau (1999), Chiappori y Salanié (2000) y Cohen (2002), entre otros. Las primeras estimaciones empíricas sobre información asimétrica datan de unos años antes, iniciándose prácticamente a principios de los años 90. Aunque ya existía algún trabajo sobre información asimétrica en el seguro de automóviles en Canadá, como Dahlby (1983), el estudio de Boyer y Dionne (1989) y unos años más tarde el de Puelz y Snow (1994) pueden considerarse pioneros en esta línea de investigación aplicada3.

  El estudio que presentamos aquí plantea un objetivo más amplio, pues trata de determinar la relación de diversas variables, y no exclusivamente del nivel de cobertura, con el número de siniestros que los conductores sufren y declaran a su compañía aseguradora. Veremos cuáles de las variables explicativas inicialmente seleccionadas se muestran significativas y en qué sentido, poniendo, al tiempo, especial énfasis en el papel que juega el hecho de que el conductor tenga residencia y circule habitualmente en Andalucía o fuera de esta Comunidad Autónoma.

  Para el desarrollo de esta investigación, se utilizan datos cedidos por una compañía de seguros privada española. Sobre los mismos, se aplica un modelo count data inflado de ceros que permite afrontar los problemas de sobredispersión que ocasiona el elevado número de ceros de la variable endógena, así como incluir todos los matices que encierra ese valor nulo. Estos modelos han tenido un gran auge en los últimos años en distintos ámbitos de la ciencia4. En relación concreta con los siniestros de automóviles, destaca la aplicación que realizan Shankar, Milton y Mannering (1997) del modelo de Poisson inflado de ceros para analizar la frecuencia de accidentes en las calzadas, distinguiendo así entre la no existencia de siniestros por ser el tramo de carretera considerado muy seguro y el no haberse registrado ningún accidente durante el periodo en estudio en un tramo inseguro. Lee, Stevenson, Wang y Yau (2002) aplican, además de ese mismo modelo, el modelo binomial negativo para observar los factores que influyen en los accidentes que sufren los conductores durante los 12 meses siguientes a la obtención del carné de conducir. Entre las aplicaciones al seguro de automóviles en España, señalamos Melgar, Ordaz y Guerrero (2005) que comparan los resultados obtenidos a través de los modelos de Poisson, binomial negativo y binomial negativo inflado de ceros, en la determinación de las variables relevantes en la siniestralidad general del sector.

  La estructura del presente trabajo es como sigue. Después de esta breve introducción, en el Apartado 1 se describe concisamente la base de datos con la que se ha trabajado, comparando especialmente su composición para Andalucía y el resto de España. El Apartado 2 se dedica a señalar las principales características de los modelos count data inflados de ceros y los motivos teóricos que nos llevan a elegir el modelo binomial negativo inflado de ceros para nuestro propósito. A continuación, en el Apartado 3 se muestran los principales resultados de la estimación realizada. Tras ello, se incluyen unas breves conclusiones en el Apartado 4. El trabajo finaliza con la relación de referencias bibliográficas empleadas.


1. ESTUDIO DESCRIPTIVO

  El análisis que se va a llevar a cabo utiliza datos del seguro de automóviles que han sido proporcionados por una compañía aseguradora privada española que opera a nivel nacional. Por motivos computacionales, se trabaja con una muestra de 15.000 pólizas correspondientes a otros tantos vehículos asegurados en dicha compañía, en el periodo comprendido entre el 16 de junio de 2002 y el 15 de junio de 2003. La información de la que se dispone se ha agrupado según las siguientes categorías:5 características del vehículo asegurado, características del conductor, características de la póliza e información referente a los siniestros. La relación de variables que finalmente se han tenido en cuenta se muestra en la Tabla 1.

  En este apartado, haremos un análisis descriptivo de la base de datos, siguiendo las categorías señaladas, y centrándonos especialmente en las diferencias que puedan existir entre los asegurados que residen y circulan habitualmente en Andalucía y los que lo hacen en el resto del territorio nacional6. A este respecto, hay que reseñar en primer lugar, como muestra la Gráfica 1, que cerca del 40% de las pólizas que componen la cartera del asegurador provienen de provincias andaluzas.



  1.1. Características del vehículo asegurado

  Las características del vehículo asegurado que hemos considerado son su tipo y el uso al que se destina.

  Se han tenido en cuenta siete tipos distintos de vehículos. Los que predominan, tanto en general como según los dos ámbitos territoriales que estamos considerando, son: turismo o furgoneta, tractor o maquinaria agrícola y ciclomotor o moto. Las restantes categorías7 en conjunto engloban únicamente alrededor de un 5% de los vehículos asegurados. Como se puede apreciar en la Gráfica 2, la categoría de turismo o furgoneta es, con mucha diferencia, la más común: algo más del 80% de los vehículos asegurados pertenecen a ella. Las otras dos categorías relevantes se reparten el, aproximadamente, 15% restante. Hay, sin embargo, diferencias notables entre ellas según la zona. Así, mientras que en Andalucía se observa que poco más de un 4% son tractores o maquinarias agrícolas y algo más de un 10% son ciclomotores o motos, en el resto de España estos porcentajes prácticamente se intercambian: los tractores o maquinarias agrícolas alcanzan casi el 9% de los vehículos asegurados, en tanto que los ciclomotores o motos apenas llegan al 6%.





  En lo que se refiere al uso, tres son los más destacados entre los once considerados8. Entre los usos particular, transporte de mercancías y agrícola, están recogidos en torno al 97,50% de los vehículos. El transporte de mercancías está presente prácticamente en la misma proporción en Andalucía y en el resto de España: 9,64% y 9,78% respectivamente. Sin embargo, hay un 5% más de vehículos con uso particular en Andalucía, que en el resto de España se destinan, en cambio, a uso agrícola, lo cual resulta lógico por el mayor número de tractores o maquinaria agrícola que se ha indicado que existen. Pueden observarse estos datos en la


  1.2. Características del conductor asegurado

  Además de la región de residencia habitual, considerada también por la aseguradora que nos ha cedido los datos como zona habitual de circulación, hemos tenido en cuenta otras características del conductor, como son la edad, el sexo y la experiencia en la conducción, medida esta última a través de los años que hace que obtuvo el carné de conducir.

  En relación con la edad, la Gráfica 4 muestra que más del 90% de los asegurados tiene 30 años ó más. Son muy pocos los que no alcanzan los 25 años: el 3,04% en Andalucía y solo el 1,91% en el resto de España; y algunos más los que están en el tramo intermedio de edad: 5,93% en Andalucía y 4,86% en el conjunto de regiones restantes.



  En lo que concierne al sexo del conductor contratante de la póliza, las cifras de distribución entre hombres y mujeres son prácticamente idénticas en Andalucía y el resto de España. El grupo mayoritario es el de los hombres, representando el 84,59% del total en Andalucía y el 85% en el resto de España.

  Por último, en lo que hace referencia a la experiencia en la conducción, casi todos los conductores llevan al menos 2 años con carné de conducir. Solamente el 1,07%, en el caso de Andalucía, y el 0,48%, en el resto de España, lleva menos tiempo conduciendo. Esa antigüedad en el carné de conducir está indudablemente relacionada con la edad de los asegurados que, como se ha visto, es superior a 30 años en gran parte de la población.

  A partir de estas observaciones, desde el punto de vista descriptivo, podemos concluir que las características de los asegurados son muy similares según procedan de Andalucía o lo hagan del resto de España, por lo que el comportamiento entre ambas poblaciones debe ser muy similar.

  1.3. Características de la póliza

  La prima anual pagada por el asegurado y la cobertura a la que tiene derecho a cambio son las características fundamentales de una póliza de seguro.

  En lo que respecta a la prima, en la Gráfica 5 se representan los porcentajes de asegurados de Andalucía y del resto de España en función de las distintas cantidades pagadas. Se han considerado varios tramos en dichas cuantías. Se observa que las primas más frecuentes son, en ambos casos, las que se sitúan entre los 300 y 400 €, seguidas por las que oscilan entre 200 y 300 €. Entre ambas categorías, suponen el 51,50% de los asegurados en Andalucía y un porcentaje algo menor para el resto de España; en concreto, el 46,80%.

  El intervalo de primas más bajas, hasta 200 €, es también en ambos casos el que presenta menor frecuencia, aunque no obstante, tiene bastante menor importancia en el caso de Andalucía, pues su peso aquí es del 7,36% de los asegurados, en tanto que para el resto de España este porcentaje alcanza el 12,17%.

  Precisamente, esta última cifra es bastante similar a la que se tiene en las tres categorías que se han considerado superiores a 400 €. A partir de aquí, el porcentaje de asegurados va disminuyendo a medida que aumenta la prima a pagar. En Andalucía, se pasa del 27,82% de asegurados con primas entre 300 y 400 € a, finalmente, sólo el 11,29% con primas superiores a 750 €; en el resto de España, del 26,19% al 12,91%.




  En cuanto a la cobertura elegida a cambio de esa prima, las cifras aparecen recogidas en la Gráfica 6. Se han definido cuatro grados o niveles de cobertura en función de las garantías contratadas en cada póliza9. Podemos destacar, en primer lugar, el hecho de que a medida que aumenta el grado de cobertura, menor es la proporción de asegurados que lo disfrutan. Hay, además, una diferencia apreciable entre el nivel más bajo y los siguientes.

  Casi la mitad de los asegurados en Andalucía disfrutan del mínimo de cobertura obligatoria; concretamente, el 49,63%. En el resto de España, sin embargo, este porcentaje es mayor: 57,37%. Este desnivel se compensa, no obstante, en los niveles de cobertura intermedios, más elegidos por los andaluces; así, mientras en Andalucía el conjunto de los dos niveles intermedios suma el 43,27% del total de asegurados, para el resto de España este porcentaje es del 34,12%. En cuanto al máximo grado de cobertura, es en el resto de España, en comparación con Andalucía, donde se da el mayor porcentaje de asegurados, si bien no con mucha diferencia, pues las cifras son del 8,51% frente al 7,10%. Por último, es también reseñable el hecho de que la suma de los porcentajes de conductores que disfrutan de un grado de cobertura semi-alto o alto es superior en Andalucía en relación al resto de España; las cifras son del 21,18% y 17,02%, respectivamente.



  1.4. Información sobre los siniestros

  Para concluir este apartado, analizamos la que será la variable endógena del análisis econométrico que realizaremos en el Apartado 3: el número de siniestros que el conductor sufre y de los que la compañía aseguradora tiene constancia, durante el periodo que hemos tomado como referencia. Esta variable la hemos denotado NUMSIN.

  Una primera visión de la Gráfica 7, donde se representa el número de siniestros registrados por la compañía, nos muestra el elevado porcentaje de asegurados que no han sufrido y/o declarado siniestro alguno a su compañía aseguradora. Esto se traduce, evidentemente, en una elevada cantidad de ceros en las observaciones de esta variable: concretamente, el 75,27% en Andalucía y, más aún, el 78,24%, en el resto de España. Asimismo, se observa que en el registro de la ocurrencia de siniestros, los porcentajes decrecen a medida que aumenta el número de los mismos. Dicho comportamiento es similar en Andalucía y en el resto de España; pero no obstante, las cifras andaluzas son en todos los casos en torno a 1 punto superiores a las del resto del territorio nacional, lo que acaba por compensar la menor proporción de datos con valor 0 que presenta. Ciñéndonos a los datos de Andalucía, comprobamos que el 16,60% de los asegurados ha declarado la ocurrencia de 1 siniestro. El porcentaje es del 5,46% en el caso de 2 siniestros y del 2,67% para 3 ó más.



  


2. METODOLOGIA


  Cuando se trata de estimar variables discretas que toman valores no negativos, los modelos econométricos que se utilizan habitualmente suelen ser los de tipo recuento o count data10. Entre ellos, los más tradicionales son el modelo de regresión de Poisson y el modelo binomial negativo.

  Para poder aplicar correctamente el primero de los modelos señalados, es necesario que la media y la varianza de la variable dependiente considerada coincidan, es decir, que haya equidispersión, lo que supone una restricción importante para su aplicación. Sin embargo, normalmente cuando el número de valores 0 observados es elevado, se suele estar ante situaciones de sobredispersión. Para abordar esta situación, se recurre entonces habitualmente al modelo binomial negativo, que es más flexible, y donde la varianza condicional es una función cuadrática de la media. En este caso, se introduce un parámetro de sobredispersión que, en caso de tender a cero, hace que el modelo binomial negativo se reduzca al modelo de Poisson.

  Recientemente, se está empleando otro tipo de modelos más complejos para los casos de sobredispersión: los modelos inflados de ceros. Éstos permiten abordar un mayor número de situaciones. Entre sus principales características, está la posibilidad que ofrecen de tener en cuenta una doble interpretación de los valores nulos, así como de establecer diferencias cualitativas que pueden existir entre los individuos según la variable tome el valor 0 o no.

  A continuación, vamos a exponer los rasgos primordiales de estos modelos.

  2.1. Modelos inflados de ceros

  Estos modelos se basan en la hipótesis de que la población consta de dos tipos de individuos: para uno de ellos, el resultado de la observación siempre adopta el valor 0; para el otro, los datos se generan según la distribución tradicional que se considere (Poisson o binomial negativa), pudiendo por tanto tomar también el valor 0. Se puede decir que, de algún modo, subyace una decisión inicial de participación en el proceso; el primer tipo de individuos ha tomado la decisión de no participar en el proceso y la consecuencia de esa no participación es el valor nulo de la variable objeto de estudio.

  La posibilidad de obtener observaciones nulas por estas dos vías conlleva, en estos casos, que el porcentaje de valores 0 observados sea elevado, con lo que podría haber sobredispersión. Los modelos inflados de ceros se emplean entonces como métodos alternativos para abordarla.

  Con respecto a los modelos estándar, se supone que la variable endógena Y es producto de una ley binaria y de la ley tradicional considerada: de manera que Z es un proceso modelizado como un logit, por ejemplo, con valores e determina el valor de bajo la condición . Cuando el individuo no participa vale cero; cuando participa ( ), se comporta según el modelo elegido. Así:

donde es la probabilidad de no participación, , y es la ley de Poisson o la binomial negativa.

  2.2. Modelo de Poisson inflado de ceros

  Cuando se elige la ley de Poisson en el desarrollo anterior, surge el modelo de Poisson inflado de ceros ("Zero-Inflated Poisson Model", ZIP), que estima la probabilidad de que la variable aleatoria Y tome el valor para el individuo i de modo que:


donde =0,1,2,... para cada individuo, y el parámetro o, de modo equivalente, , el de los coeficientes a estimar.

  A partir de esta formulación, se pueden deducir las igualdades y Si todos los individuos participan en el proceso, es decir si , ambas expresiones coinciden. Hay entonces equidispersión y el modelo se reduce al modelo de Poisson habitual.

  Dependiendo de la ley que se elija para , surgen distintas variantes del modelo ZIP. En nuestro caso, el software con el que trabajamos11 usa la conocida como ZIP(), basada en el supuesto de que sigue una distribución logística en función de un nuevo parámetro (Greene, 1995). Esta formulación tiene el inconveniente de que el modelo tradicional y el inflado de ceros no están anidados, con lo cual resulta más complejo determinar si la distribución es realmente Poisson o Poisson inflada de ceros, en comparación con lo que sería si únicamente hubiera que contrastar la nulidad de un parámetro.

  2.3. Modelo binomial negativo inflado de ceros

  Tomando como referencia en la ecuación [1] el modelo binomial negativo, obtenemos la distribución de probabilidades para el modelo binomial negativo inflado de ceros ("Zero-Inflated Negative Binomial Model", ZINB), que viene dada por:



donde, de nuevo, , es la probabilidad de no participación y v un parámetro positivo
12.

  En función del parámetro de precisión13 >0, que se define como , se puede demostrar que los momentos vienen dados en este caso por las expresiones y . Si , dichas expresiones son similares a los del modelo de Poisson inflado de ceros; mientras que si =0, coinciden con las del modelo binomial negativo14. Si se dan ambas condiciones al mismo tiempo, el modelo resultante es el de Poisson, con media y varianza iguales.

  Por tanto, el contraste del valor nulo de los parámetros y sería el que determinaría, en la práctica, cuál es el modelo más adecuado para nuestros datos. Sin embargo, si consideramos, como en el caso del modelo ZIP(), que sigue una distribución logística,, resulta de nuevo que el modelo binomial negativo y el correspondiente inflado de ceros no están anidados, lo que complica la elección entre ambos.

  2.4. Método de estimación

  Para obtener los valores estimados de los parámetros, se utiliza el método de máxima verosimilitud. La función de verosimilitud no es más que la función de probabilidad conjunta que se deduce de cada modelo y que, de forma general, podemos expresar como . Las expresiones concretas de estas funciones para los distintos tipos de modelos count data referidos pueden verse en Melgar y Guerrero (2005).

  Para contrastar la significatividad individual de cada parámetro y, en consecuencia, de la variable explicativa correspondiente, se utiliza el estadístico z que sigue una distribución normal tipificada, de modo que , siendo z el cociente entre el valor estimado de cada coeficiente y el error estándar y el nivel de significación elegido. Para un nivel de significación del 5%, valores de z mayores en valor absoluto que 1,96 indicarán significatividad de la variable asociada en la estimación.

  Como se ha indicado anteriormente, los modelos inflados de ceros formulados en función del parámetro no se reducen a los modelos tradicionales cuando este parámetro toma el valor 0, con lo que las verosimilitudes no son directamente comparables. Vuong (1989) define un estadístico que permite decidir entre ambos modelos y que viene dado por la expresión:



siendo , y las funciones de probabilidad para el modelo inflado de ceros y el tradicional, respectivamente, y.

  Este autor demuestra que V es un estadístico bidireccional con una distribución asintótica normal tipificada. Cuando es menor que 1,96 el contraste no permite decantarse por uno u otro modelo; en caso contrario, un valor positivo es una evidencia a favor del modelo inflado de ceros, mientras que un valor negativo de V favorece el modelo tradicional.



3. RESULTADOS


  Una vez que en los apartados anteriores hemos presentado las principales características que definen la base de datos con la que trabajamos, así como la tipología de modelos que consideramos, pasamos ahora, en este apartado, a mostrar los principales resultados del análisis econométrico que hemos llevado a cabo. Al tiempo que veremos cuáles son las variables que resultan determinantes a la hora de estimar el número de siniestros que sufren los conductores asegurados y que declaran a sus compañías, nos fijaremos en nuestro principal objetivo en este trabajo, que es comprobar si existen diferencias significativas en dicho fenómeno de la siniestralidad entre los conductores que residen y circulan por la Comunidad Autónoma de Andalucía y los que lo hacen en el resto del territorio nacional.

  Como ya se ha indicado a lo largo del trabajo, consideramos una población de 15.000 asegurados de cierta entidad privada española. La variable endógena, NUMSIN, toma valores discretos y no negativos, lo que hace que sea apropiado usar para su estimación un modelo econométrico tipo count data. Nos hemos decantado, en principio, por el modelo binomial negativo inflado de ceros por varios motivos. En primer lugar, el porcentaje de ceros observados en esta variable es muy elevado. Hemos visto en el Apartado 1.4 que, en el caso de Andalucía era un 75,27%, y para el resto de España, un 78,24 %. Considerando la población en su totalidad, el porcentaje de conductores que no ha declarado ningún siniestro a su compañía de seguros durante el periodo considerado asciende al 77%. Esto hace que haya sobredispersión en los datos, lo que desaconseja el uso de los modelos de Poisson. Por otro lado, debemos tener en cuenta las diferencias cualitativas que existen en los asegurados que sufren siniestros y los que no lo hacen. En general, podemos pensar que los primeros tienen una actitud más descuidada, ya sea en la conducción, en el mantenimiento y/o en la elección del lugar de aparcamiento, por ejemplo, y ya sea por propia dejadez o por ser inherente en ellos. A este hecho hay que añadirle la doble interpretación que podemos hacer de una observación nula de la variable endógena. En efecto, este valor nulo puede deberse a que el conductor asegurado no ha sufrido efectivamente ningún siniestro o a que, aún habiendo tenido algún accidente, ha optado por no dar conocimiento de ello a su aseguradora. Estas características nos hacen pensar que sería conveniente inclinarse, para una estimación más exacta, hacia un modelo inflado de ceros, a pesar de que, hasta ahora, no ha sido muy habitual su uso en el seguro de automóviles.

  Así pues, hemos aplicado el modelo binomial negativo inflado de ceros, quedándonos, de entre las distintas simulaciones efectuadas, finalmente con la que se muestra en la Tabla 2. El valor obtenido para el estadístico de Vuong (9,0529) confirma que debemos decantarnos por el modelo ZINB frente al tradicional correspondiente; por otro lado, la significatividad del parámetro Alpha indica que éste es más adecuado para la modelización que proponemos que el modelo ZIP.15

  Es preciso señalar, asimismo, que las variables que se han introducido como exógenas en el análisis son las que se han considerado en el Apartado 1 de este trabajo. Como pudo entonces comprobarse en la descripción que se hizo de las mismas, son de tipo categórico, por lo que la consideración de las distintas categorías en el modelo se ha hecho a través de las correspondientes variables ficticias.

  Al nivel de confianza del 95%, son 17 las variables (o categorías) explicativas (incluyendo el término independiente) que se han mostrado significativas en la estimación del número de siniestros sufridos y declarados a la compañía por los asegurados, como se puede apreciar en la Tabla 2.


  Las variables relativas a características del vehículo asegurado se han mostrado como relevantes en algunas de sus categorías, como vemos seguidamente.

- En lo que hace referencia al tipo de vehículo asegurado, camiones ("CAMION"), remolques, ("REMOLQUE") y ciclomotores o motos ("CICL_MOT") son las categorías que muestran un comportamiento significativamente distinto al del resto de vehículos. Concretamente, la siniestralidad es, en los tres casos, menor que la que se observa en el resto de categorías en su conjunto, y, en particular, que en la categoría más frecuente: recordemos, la de turismos o furgonetas. El número de siniestros que se espera entre los remolques es el menor de todos, seguido por los de los ciclomotores o motos, siendo los camiones los que muestran más siniestralidad si comparamos estas tres categorías únicamente.

- En cuanto al uso del vehículo, el industrial ("USO_INDU") y el agrícola propio ("USO_AGRI") tienen propensión a sufrir menos siniestros que los vehículos destinados a otros usos. Además, la siniestralidad de los segundos es aún menor que la de los primeros. Otra categoría que se muestra significativa, según señala la Tabla 2, es la de transporte escolar ("USO_TESC"), aunque en este caso el comportamiento es el contrario: la siniestralidad es más acentuada que para los demás vehículos.

  Entre las características del asegurado, no se ha observado relevancia de las variables "EDAD" y "SEXO", lo que significa que, desde el punto de vista estadístico, no existen diferencias significativas de comportamiento entre conductores de distintas edades ni entre hombres y mujeres, cuando se trata de analizar el número de siniestros sufridos y declarados a la compañía aseguradora. Sí muestran, en cambio, influencia notable la experiencia en la conducción y la región de residencia y circulación habitual. Comentamos a continuación el sentido de la significatividad de dichas variables.

- La antigüedad en el permiso de conducir, según la cual medimos la experiencia del conductor, está fuertemente relacionada con el número de siniestros sufridos. Si el conductor sacó el carné de conducir hace menos de 2 años (según recoge la variable "ANTIG_2A"), se observa que su comportamiento es distinto del que tienen los asegurados que llevan más tiempo conduciendo. Esta diferencia se traduce en un mayor número de siniestros.

- Si prestamos atención al papel de la región de circulación habitual del conductor, nuestro principal objetivo en este trabajo, vemos cómo la variable "ANDALUCI" es significativa en el análisis que hemos llevado a cabo. El signo positivo del coeficiente asociado a esta variable en la Tabla 2 indica que la siniestralidad es mayor para los conductores que viven y circulan habitualmente en Andalucía que para los asegurados del resto de España. Estos resultados están en concordancia con los resultados que se intuían a partir del análisis descriptivo mostrado en la Gráfica 7.

  Analizamos, para finalizar, el último grupo de variables consideradas en la Tabla 1. Tanto la prima anual pagada por el asegurado como el grado de cobertura de que disfruta a cambio, son de suma importancia a la hora de determinar la posible siniestralidad de los conductores, como vemos en los siguientes comentarios.

- Todos los tramos en los que hemos clasificado las primas se muestran significativos en nuestro análisis. Los coeficientes positivos y crecientes apuntan un mayor número de siniestros a medida que aumenta la prima en relación con la categoría base, formada por las primas inferiores a 200 €. Concretamente la siniestralidad es prácticamente el doble cuando la prima es superior a 750 € ("P750_") que cuando está comprendida entre 200 y 300 € ("P200_300"); entre tramos consecutivos, el incremento se sitúa entre el 10 y el 20%, aproximadamente.

- El grado de cobertura del que disfruta el asegurado es también una variable muy relevante a la hora de analizar la siniestralidad. En todos los casos ésta es mayor que en el caso en que el conductor solo está asegurado según el mínimo obligatorio. Los grados intermedios ("GR_MBAJO" y "GR_MALTO") están bastante parejos, pero el nivel más elevado de cobertura ("GR_ALTO") conlleva una siniestralidad más notable. Esto parece ratificar la predicción teórica que se tiene en los mercados con información asimétrica entre las partes, sobre la correlación entre un mayor nivel de cobertura y una mayor siniestralidad, aunque no podemos determinar si ello se debe a la existencia de riesgo moral (que haría que el asegurado se descuidara, sabedor de que está asegurado contra cualquier contingencia que pudiera ocurrirle) o bien, a la de selección adversa (el conductor puede haberse asegurado al máximo consciente de su alta propensión a sufrir siniestros).


4. CONCLUSIONES


  El análisis que hemos llevado a cabo tenía como principal objetivo determinar si el hecho de residir y circular habitualmente en Andalucía supone un factor relevante a la hora de hablar de siniestralidad en el seguro de automóviles.

  Hemos trabajado con los datos que nos ha cedido una entidad aseguradora privada que opera a nivel nacional, estimando el número de siniestros que los conductores sufren y declaran a su compañía de seguros a partir de una especificación del modelo binomial negativo inflado de ceros. Hemos descartado el uso de otros modelos de tipo count data, como el modelo de regresión de Poisson, por el elevado número de ceros que presenta la variable dependiente, o el modelo binomial negativo, por no tener en cuenta las diferencias cualitativas entre los asegurados que sufren siniestros y los que no, ni la doble interpretación que se le puede dar a las observaciones nulas. El modelo binomial negativo inflado de ceros sí permite recoger la posibilidad de que dicho valor sea debido a la no ocurrencia de siniestro o, por el contrario, a su no declaración a pesar de haber tenido lugar.

  Los resultados de nuestro análisis econométrico han mostrado una serie de variables que resultan relevantes, bien por su incidencia positiva o bien negativa, en los procesos de ocurrencia de siniestros recogidos por las entidades aseguradoras del ramo de automóviles. Es el caso de algunos tipos de vehículos, como camiones, remolques y ciclomotores o motos; algunos usos, concretamente el agrícola propio, el industrial y el transporte escolar; la experiencia en la conducción; la prima pagada; y el grado de cobertura. Con respecto a esta última variable, y en el sentido de los trabajos empíricos existentes en otros países con relación a la presencia de información asimétrica en los datos, se observa que se cumple la predicción teórica, al aumentar la siniestralidad a medida que lo hace la cobertura.

  Asimismo, nuestra investigación concluye, como así parecía indicar el análisis descriptivo previo realizado, que la siniestralidad resulta algo mayor en la Comunidad Autónoma de Andalucía que en el resto de España, considerada en su conjunto.

 



Notas a pié de página


1 IEA (2005).

2 Chiappori (1999) hace un repaso de los principales estudios, hasta ese momento, sobre estas cuestiones.

3 Los estudios de tipo teórico aparecen antes en el tiempo, en los años 70, centrándose fundamentalmente en el análisis de las relaciones contractuales en general, donde se da información asimétrica entre las partes.

4 Son significativas las aplicaciones que se dan en el ámbito de la Economía de la Salud. Un ejemplo lo constituye Jones (2001).

5 La clasificación que usamos es muy similar a la que hacen Dionne et al. (1999) y Cohen (2002), entre otros. Conviene señalar, no obstante, que la información sobre vehículos y conductores de la que disponen las aseguradoras de otros países suele ser más completa que la que se tiene en España.

6 Puede verse un análisis descriptivo más pormenorizado de la base de datos en Melgar, Ordaz y Guerrero (2004).

7 Se incluyen aquí los vehículos de tipo camión, remolque, autocar y vehículo industrial.


8 Los vehículos se han clasificados según se destinen a uso particular, servicio público, alquiler, escuela de conductores, compra-venta, industrial, transporte de mercancías, transporte escolar, transporte general de viajeros, agrícola o retirada de permiso de conducir.

9 El nivel bajo de cobertura incluye las garantías de responsabilidad civil obligatoria, responsabilidad civil suplementaria, defensa y reclamaciones, asistencia en viaje, muerte e invalidez del conductor. En los niveles intermedios, se añade además alguna garantía opcional, como rotura de lunas, incendio, robo y/o retirada de permiso de conducir. Por fin, el nivel más alto de cobertura incluye todos los daños del vehículo, tanto si el conductor contrario ha sido identificado como si no, y ya sean daños parciales o de pérdida total del vehículo.

10 Pueden consultarse Cameron y Trivedi (1986) y Winkelmann (2003) para tener una visión general de estos modelos.

11 Limdep v. 7.0.

12 Este parámetro surge del modelo binomial negativo en el que se supone que la variable sigue una distribución de Poisson con parámetro se distribuye según una gamma de parámetros

13 Este parámetro es introducido por Jones (2001) y es una medida del grado de sobredispersión.

14 En el modelo binomial negativo,

15 Existen otras posibles formas de discriminar entre ambos modelos inflados de ceros, como por ejemplo el test de Ridout, Hinde y Demétrio (2001).

 


References

Boyer, M. & Dionne, G. (1989). An Empirical Analysis of Moral Hazard and Experience Rating. Review of Economics and Statistics, 71, 128-134.

Cameron, A. & Trivedi, P. (1986). Econometric Models Based on Count Data: Comparison and Applications of Some Estimators and Tests. Journal of Applied Econometrics, 1, 29-54.

Chiappori, P.A. (1999). Asymmetric Information in Automobile Insurance: an Overview. In G. Dionne & C. Laberge-Nadeau (Ed.), Automobile Insurance: Road Safety, New Drivers, Risks, Insurance Fraud and Regulation (pp. 1-11). Boston: Kluwer Academic Publishers.

Chiappori, P.A. & Salanié, B. (2000). Testing for Asymmetric Information in Insurance Markets. Journal of Political Economy, 108, 1, 56-78.

Cohen, A. (2002). Asymmetric Information and Learning: Evidence from the Automobile Insurance Market. Discussion Paper 371, Harvard Law School, Cambridge.

Dahlby, B. (1983). Adverse Selection and Statistical Discrimination: An Analysis of Canadian Automobile Insurance Market. Journal of Public Economics, 20, 121-131.

Dionne, G.; Gouriéroux, C. & Vanasse, C. (1999). Evidence of Adverse Selection in Automobile Insurance Markets. In G. Dionne & C. Laberge-Nadeau (Ed.), Automobile Insurance: Road Safety, New Drivers, Risks, Insurance Fraud and Regulation (pp. 13-46). Boston: Kluwer Academic Publishers.

Greene, W.H. (1995). Limdep Version 7.0: User´s Manual. Bellport, NY: Econometric Software.

IEA - Instituto de Estadística de Andalucía (2005). Estadísticas del Sistema Financiero en Andalucía. Entidades de seguros. Año 2002. Junta de Andalucía.

Jones, A.M. (2001). Applied Econometrics for Health Economists - A Practical Guide. Londres: Office of Health Economics.

Lee, A.H.; Stevenson, M.R.; Wang, K. & Yau, K.K.W. (2002). Modeling Young Driver Motor Vehicle Crashes: Data with Extra Zeros. Accident Analysis and Prevention, 34, 515-521.

Melgar, M.C.; Ordaz, J.A. & Guerrero, F.M. (2004). The Main Determinants of the Number of Accidents in the Automobile Insurance: an Empirical Analysis. Études et Dossiers, 286, 45-56.

Melgar, M.C. & Guerrero, F.M. (2005). Los Siniestros en el Seguro del Automóvil: un Análisis Econométrico Aplicado. Estudios de Economía Aplicada, 23, 1, 355-375.

Melgar, M.C.; Ordaz, J.A. & Guerrero, F.M. (2005). Diverses Alternatives pour Déterminer les Facteurs Significatifs de la Fréquence d´Accidents dans l´Assurance Automobile. Assurances et Gestion des Risques-Insurance and Risk Management, 73, 1, 31-54

Puelz, R. & Snow, A. (1994). Evidence on Adverse Selection: Equilibrium Signalling and Cross-Subsidization in the Insurance Market. Journal of Political Economy, 102, 2, 236-257.

Richaudeau, D. (1999). Automobile Insurance Contracts and Risk of Accident: An Empirical Test Using French Individual Data. Geneva Papers on Risk and Insurance Theory, 24, 97-114.

Ridout, M.; Hinde, J. & Demétrio, C.G.B. (2001). A Score Test for Testing a Zero-Inflated Poisson Regression Model against Zero-Inflated Negative Binomial Alternatives. Biometrics, 57, 219-223.

Shankar, V.; Milton, J. & Mannering, F. (1997). Modeling Accident Frequencies as Zero-Altered Probability Processes: an Empirical Inquiry. Accident Analysis and Prevention, 29, 6, 829-837.

Vuong, Q.H. (1989). Likelihood Ratio Tests for Model Selection and Non-Nested Hypotheses. Econometrica, 57, 307-333.

Winkelmann, R. (2003). Econometric Analysis of Count Data. Berlin: Springer.


About the Author

Autor: Mª del Carmen Melgar Hiraldo
Dirección: Universidad Pablo de Olavide
Correo electrónico:
mcmelhir@upo.es

Autor: José Antonio Ordaz Sanz
Dirección: Universidad Pablo de Olavide

 

 

 

DOCUMENTOS DE TRABAJO EN ANÁLISIS ECONÓMICO (EAWP)
Derechos reservados 2002. El permiso para reproducir algún artículo está garantizado si Documentos de Trabajo en Análisis Económico lo acredita, las copias no son vendidas y es en acto de mayor difusión del documento.

Editor:
Fernando González-Laxe. (Universidade da Coruña)
Director:
Venancio Salcines. (Universidade da Coruña)
Subdirector:
Andrés Blancas. Instituto de Investigaciones Económicas (UNAM)
Editor Asociado para America Latina:
Luis Miguel Galindo. Facultad de Ecomomía (UNAM)


© 2022 Colexio da Coruña. Revistas Editadas en España, América Latina y el Caribe incluidas en EconLit
COLDATA | Inicio