DIPLOME UNIVERSITAIRE DE SEQUENCAGE HAUT DEBIT ET BIO-INFORMATIQUE POUR L’ANALYSE DE DONNEES EN BIOLOGIE MEDICALE

Introduction


Public cible
→ Licence, Master ou Doctorat en Biologie.
→ Pharmacien ou Médecin en Biologie ou Génétique médicale.
→ Ingénieurs en Biologie ou Génétique médicale.
→ Internes (Pharmacie ou Médecine) ou Stagiaires dans ces disciplines.

Objectifs
→ Introduction à l’usage de langage de programmation pour le traitement de données en biologie.
→ Analyses de données : mise en œuvre de stratégies d’analyses de données bio-médicales (alignement, filtration, annotation des variants,etc).
→ Introduction aux bases de données, outils bio-informatiques et logiciels nécessaires à l’analyse des données de biologie médicale.
→ Réglementation en santé : accréditation des nouvelles technologies NGS et bonnes pratiques cliniques.


Module 1: Initiation à la Programmation et à la Bio-informatique



Programmation

Initiation aux langages de programmation: Awk et R

Toutes les ressources informatiques sont disponibles à cette URL [Link]



Langage Awk

Le langage de programmation Awk spécialisé dans la manipulation de fichiers texte [1] est très populaire au sein de la communauté bio-informatique pour la préparation des données avant leur traitement par des logiciels bio-informatiques ou bio-statistiques.



R est un langage de programmation [2] et un logiciel libre destiné aux statistiques et à la science des données soutenu par la R Foundation for Statistical Computing. Il fait partie de la liste des paquets GNU3 et est écrit en C (langage), Fortran et R. (Source: Wikipedia).

Le langage R


Outils bio-informatiques

Les logiciels bio-informatiques reposent sur quelques principes fondamentaux qu'il est important de connaitre et de savoir maitriser afin de les utiliser correctement.



Références

  • [1] The GNU Awk User’s Guide [Link]
  • [2] The R Project for Statistical ComputingLink]

Acronymes et Abréviations

  • HTML: HyperText Markup Language
  • NCBI:National Center for Biotechnology Information
  • VCF:Variant Call Format, format utilisé en bioinformatique pour le stockage de variations dans les séquences génétiques

Created by Jean-Christophe Taveau — MS in Bioinformatics, Bordeaux, France