Soumis par laetitia_benezet le jeu 09/01/2020 - 11:05

Individus présents dans la table

Les individus n’ayant pas renvoyé le questionnaire calendrier professionnel (ie ceux ayant SUIVI_REP_CP=1 dans la table DATA_CP) sont présents dans la table DATA_CPPER alors que pour la table DATA_EXPOCAR seuls les individus ayant rempli le questionnaire sont présents (ie. ceux ayant SUIVI_REP_ EXP=1 dans la table DATA_EXPO). Pourquoi cela n’est pas uniforme ?

Indicateur de codage

  • CodPerSTATUT

La variable CodPerSTATUT a seulement 2 modalités contre 3 dans le dictionnaire de données (1="Validé" 2="Validé Non Codable" 3="Validation en attente"). D’après les réponses précédentes il est normal de ne pas avoir la modalité 3 (Réponse de S Bonenfant sur le document comportant les questions sur les CP_CONSTANCES_SpF-SBO-FG.docx : « Seuls les données de codage des CP avec TOUS les EP étaient codés 1=Validé à la fin de 2018 ont été rapatriés et potentiellement mis à disposition lors de la livraison de données ». Mais on a tout de même 2077 épisodes sans PCS ni NAF (respectivement égale à #### et ##### = Pas d'information utile pour coder) et qui devraient avoir la modalité CODPERSTATUT=2="Validé Non Codable". Cela permettrait également de repérer les personnes dont les calendriers n’ont pas du tout été codés.

  • EPNR/CPNR

L’indicateur CPNR a été créé pour repérer les calendriers professionnels vides (ie sans aucune PCS ni NAF), cependant il y a quelques incohérences sur cet indicateur car pour certains individus on a CPNR=1 (non réponse au calendrier) mais des codes PCS ou NAF sont pourtant disponibles.

L’indicateur EPNR a été créé pour repérer les épisodes professionnels vides (ie sans PCS ni NAF) mais là aussi on a quelques incohérences car 209 épisodes sont repérés comme EPNR=1 alors que l’on dispose d’un code NAF ou PCS (cf tableau suivant), ils devraient plutôt être codés en EPNR=0 (et le cas échéant CPNR devraient être recodé également). Par ailleurs on a également 650 épisodes avec EPNR=0, donc pour lesquels on s’attend à avoir un code NAF ou PCS, mais dont les PCS et NAF n’ont pas pu être codées (égaux à #### et ##### simultanément). Il conviendrait d’uniformiser cet indicateur lorsque PCS et NAF sont « Pas d'information utile pour coder ».

Exemple CPNR et PCS ou NAF

Dates d’emploi ou d’interruption incohérentes

Des incohérences ont été relevées dans le fichier de données :

  • Les dates de fin d’emploi (variable finp-cor) sont, pour certaines « inférieures » aux dates de début d’emploi (variable debp-cor) ;
  • Les dates de fin d’interruption (variable debi-cor) peuvent être « inférieures » aux dates de début d’interruption (variable fini-cor) ;
  • Les dates de fin d’emploi peuvent être supérieures aux dates de début d’interruption (les dates se chevauchent) mais aussi des dates d’interruption peuvent « se retrouver à l’intérieur » de la période d’emploi ;
  • La durée des emplois a été calculée et dans le panel, on se retrouve avec des durées extrêmes allant jusqu’à 118 ans pouvant être expliqué en partie par des emplois simultanés (à titre d’exemple pour un sujet, date de son 1er emploi : 1974-2012, 2ème emploi 1975-2015, 3ème emploi 1978-1996, 4ème emploi 1984-2000 et 5ème  emploi 2001-2012).
    A noter que, les dates d’emploi initialement corrigées (periodDe_N /  periodA_N) et les dates corrigées par la suite (debp_cor / finp_cor) sont quasi-identiques. Il en est de même pour les dates d’interruption. Est-ce que les algorithmes de correction concernant les dates ont bien  été appliqués? Si non appliqué, cela pourrait expliquer les incohérences observées ci-dessus.

 

« Fausses » périodes d’activité

Les épisodes qui ne sont pas des périodes d’activité (chômage, longue maladie, retraite, études…) déclarées à l’intérieur des périodes d’emploi ont été laissés comme telles et repérées avec des codes spécifiques. Les personnes qui ont bien suivi la consigne ont déclaré ces évènements dans les périodes d’arrêt. Si l’on n’exclut pas ces lignes (sélection sur les codes PCS et NAF) on peut les comptabiliser à tort comme des emplois et inversement manquer des périodes d’inactivité si l’on se restreint à regarder les périodes d’arrêt. Est-ce qu’elles pourraient être recodées en périodes d’arrêt ou à défaut créer un top qui repère les « vrais emplois » à partir des PCS et NAF pour que tous les utilisateurs n’aient pas à le refaire et notamment ceux qui ne sont pas familiers avec les nomenclatures ?

Uniformisation des codages

Les codes NAF ne sont pas toujours codés sur le même nombre de digits quand des divisions (2 chiffres) groupes ou classe ne correspondent qu’à un seul code sur le niveau qui suit. Il en est de même pour les codes PCS (cf. exemples non exhaustifs sur les tableaux suivants).

Les secteurs non codables (****) et information insuffisante pour coder (#####) pourraient être uniformisés en #####.

Uniformisation codage