Septembre 2015 | September 2015



Revue de presse, Septembre 2015

A. Beliard, J. Lecoz, E. Ledant, N. Oliveira da Costa, E. Penneçot, S. Schrefheere

Bonjour à toutes et à tous ! Nous vous souhaitons la bienvenue dans ce premier numéro de la revue de presse. Nous avons l’honneur d’ouvrir le bal avec plusieurs articles qui, ce mois-ci, ont retenu notre attention. Provenant de domaines divers et variés, de la génomique aux biotechnologies, nous allons vous faire voyager à travers différents sujets qui nous ont tantôt intéressés, tantôt nous ont fait nous questionner. Dans ce numéro, il sera question de génomique mais aussi de capteurs dans des pilules ou encore des neurones artificiels ! En espérant que cette sélection vous plaise, nous vous souhaitons une bonne lecture !



Article #1

Dans ce premier article [1] paru dans Gene, les auteurs ont pour but de déterminer les mécanismes génétiques du glioblastome. L'élucidation des mécanismes pathogénétiques du glioblastome est un enjeu de santé public important car le glioblastome est le cancer du cerveau le plus courant et que le taux de survie à 3 ans est de seulement 2 % avec les thérapeutiques actuelles. Pour cela les auteurs ont récupéré des données de séquençage de cellules saines et cancéreuses et les données des voies de signalisation intracellulaire dans des bases de données publiques. Ensuite grâce à des t-tests ils ont mesuré les différences d'expression des gènes entre cellules normales et cancéreuses. Ils ont pu déterminer les voies métaboliques perturbées dans la survenue du cancer grâce à des corrélations de Pearson qui permettent de mesurer l'expression différentielle des gènes d'une même paire et en ne gardant que les gènes dont l'expression différentielle est inversée entre cellules saines et cancéreuses. L'étude a montré que la survenue du glioblastome passe par 14 voies métaboliques majeures qui sont inversées entre cellules normales et cancéreuses.



Toujours dans le domaine de la génomique, les auteurs d'un rapport [2] publié sur Scientific Reports présentent le logiciel SeqMule[3], un pipeline automatisé pour l'analyse de données d'exome ou de génome humain et la détection de maladies Mendéliennes. Ce pipeline intègre 5 outils d'alignement et 5 algorithmes pour la détection de variants, sélectionnés selon leur popularité, leur performance et de leur facilité d'utilisation. Ils présentent ensuite la manière dont leur logiciel va traiter les jeux données. Une fois les analyses terminées le logiciel génère une page HTML[cf] intégrant l'alignement des séquences, les statistiques sur les variants, le taux d'erreur mendélienne et un diagramme de Venn sur le chevauchement de différents VCF[cf]. Enfin, les auteurs présentent les résultats de SeqMule obtenus par l'analyse de 3 jeux de données issues du projet 1000 Génomes[4]. Le logiciel semble être efficace affichant notamment des taux de concordance selon différents outils d'alignement de 93 % et un temps de traitement variant entre 20 et 54h.

Article #2


Article #3

Nouvel article[5], nouveau sujet, cette fois-ci tourné vers les Neurosciences avec un article de vulgarisation scientifique publié dans Sciences et Avenir nous présentant une application médicale de la biomimétique. L'institut de Karolinska (Suède), qui décerne chaque année le prix Nobel de physiologie et médecine, a mis au point un neurone artificiel capable de détecter un neurotransmetteur et d'en libérer à son tour de manière régulée. Le biocapteur du neurone artificiel est constitué d'enzymes attachées à une pointe métallique. La réaction chimique induite par l'enzyme en présence du neurotransmetteur génère un signal électrique qui est contrôlé par une puce électronique et se propage dans le neurone. A l'extrémité du neurone se trouve une pompe à ions faite d'un plastique conducteur, ce qui permet la libération de neurotransmetteurs en fonction de l'influx électrique reçu. Des ions positifs sont ensuite pompés pour équilibrer les charges. Ainsi, ces neurones artificiels sont très prometteurs pour le traitement des maladies neurodégénératives comme Parkinson, dans lesquelles ils doivent permettre de remplacer les neurones perdus.


Pour rester dans le même sujet, cet article [6] est paru dans Science et Avenir ce mois-ci s'intitulant "Quand les machines apprennent toutes seules". Il y est question d'intelligence artificielle et notamment d'une technique d'apprentissage automatique appelée le deep learning. Le deep learning est une déclinaison du machine learning basée sur une approche de réseaux convolutifs. Réseaux convoluQUOI ? Je m'explique, l'idée est de mettre en place un réseau de neurones artificiels de façon à intégrer les données qui sont alors connectées entre elles, un peu comme dans notre cerveau (en beaucoup moins complexe bien évidemment !). Pour entraîner le programme, il faut lui fournir des données, c'est ce qu'on appelle l'apprentissage supervisé, on aide le programme à "apprendre". Le réseau de neurones est composé de milliers d'unités. Chaque unité effectue un petit calcul simple et envoie le résultat vers une autre unité de calcul, et ainsi de suite. C'est de ce fonctionnement par "couches" que provient la profondeur (deepness). Cet outil est déjà présent dans de nombreuses applications smartphones telles que Google Now. Il est aussi utilisé pour la reconnaissance de visage (Facebook) ou encore comme outil de conversation vocales (Skype). Il permet par exemple de reconnaître le contenu d'une image ou de comprendre le langage parlé. Là où le deep learning est une technique révolutionnaire est qu'avant, il fallait expliquer à l'ordinateur comment transformer une image afin de la classifier. Maintenant, la machine apprend à le faire elle même.

Si ce sujet vous intéresse voici d'autres liens [7]

Article #4


Article #5

Passons au sujet médical, avec un communiqué de presse [8] publié sur Proteus Digital Health qui nous a interpellé. L'observation du traitement par les patients est un enjeu médical actuel. On estime à environ 50 % les personnes souffrant de troubles de la mémoire ou de maladies mentales abandonnant leur traitement. Cet oubli entraîne des risques d’aggravation de leur état. La société Proteus, spécialisée en biotechnologies industrielles, a développé un médicament du nom d'Ability. Celui-ci est constitué d'une pilule contenant un capteur. Lorsque la capsule est digérée, le capteur libéré envoie un signal radio enregistré par un patch porté par le patient. Ainsi, le médecin peut vérifier à l'aide d'un logiciel si le traitement a bien été pris. Cette méthode innovante va donc permettre un meilleur suivi des malades souffrant de troubles mentaux comme la schizophrénie. Cet article a entrainé un questionnement de notre part: est-il éthique de récupérer des informations de cette manière? Est-ce aux médecins de surveiller l'observance des patients? Comment seront-utilisées ces données?


Le dernier article[9,10] de cette revue de presse est paru sur Frontiers in Microbiology et nous parle de microbiologie et de symbiose.Un petit calamar de moins d’un demi-centimètre, nommée Euprymna scolopes est connu pour avoir une symbiose avec Vibrio fischeri; bactérie ayant permis la découverte de la luciférine et l'étude de la détection du quorum. Cette symbiose aide au camouflage du calamar.17 ans après la mise en évidence de cette symbiose, une seconde symbiose a été découverte. L’équipe du Nyhom Lab s’est intéressée à une glande présente dans l’organe de ponte de l’animal dont la fonction précise est encore méconnue. Une analyse génomique de l’ADN présent dans cette glande, qui inclue du séquençage Illumina et des analyses taxonomiques utilisant les génomes déjà séquencés dans les bases de données du NCBI[cf], a permi d’identifier plusieurs familles de bactéries dont une dominante, celle des Roseobacter, connue pour ses sécrétions de composés antimicrobiens et antifongiques. De plus les bactéries présentes dans cette glande semblent aussi apte à la détection d'un quorum comme l'est Vibrio fischeri. En effet on retrouve la présence d'une paire de protéines semblables à celles activant la luciférine. Cette paire de protéines jouerait ici un rôle dans la croissance bactérienne ou dans la production du biofilm recouvrant les oeufs. Ces nouvelles découvertes sont intéressantes pour l’industrie pharmaceutique qui pourrait trouver de nouveaux composés alors qu’à l’heure actuelle le nombre d’antibiotiques efficaces se compte sur les doigts d’une main.

Si cet article vous a intéressé en voici un autre traitant de remplaçants potentiels aux antibiotiques, les bactériophages[11]!

Article #6



Références Bibliographiques

Acronymes et Abréviations

  • HTML: HyperText Markup Language
  • NCBI:National Center for Biotechnology Information
  • VCF:Variant Call Format, format utilisé en bioinformatique pour le stockage de variations dans les séquences génétiques

Octobre 2015 | October 2015



Revue de presse, Octobre 2015

L. Ahmed Zaid, E. Allery, S. Aupetit, F. Bertolo, E. Duquenne, A. Miramon

Bonjour à tous, et bienvenue pour cette deuxième revue de presse. Notre édition est principalement tournée vers différents outils bioinformatiques nouvellement créés, que ce soit pour la construction de réseaux de protéines, l'annotation et la classification de gènes ou encore la réalisation d'un modèle computationnel pour la propagation d'une bactérie. Mais elle traite également de modélisation de génome et de virus.

En vous souhaitant une excellente lecture de cette sélection mensuelle!!



Article #1

Dans ce premier article [1]paru dans BMC Bioinformatics, les auteurs cherchent à obtenir un modèle computationnel, c'est à dire créer un modèle informatique permettant la réalisation d'expériences complètes, basé sur les mathématiques et des données obtenues par de précédentes expériences. Ce modèle doit être le plus réaliste possible afin d'observer la propagation de la bactérie Wolbachia chez une population de moustiques après introduction de semblables infectés. L'intérêt de l'introduction de cette bactérie au sein de populations natives est de contrôler les maladies vectorielles telles que la Dengue, touchant 50 millions de personnes par an. Cette étude montre ainsi que le modèle computationnel utilisé donne des résultats proches de ceux obtenus par les modèles mathématiques et les études sur le terrain. Ainsi, les modèles computationnels représentent une approche prometteuse et complémentaire aux méthodes plus traditionnelles, ainsi qu'un coût économique plus faible pour un nombre d'expériences plus important et plus facile à mettre en place.



Dans un article publié dans Nature [2], les auteurs présentent la reconstruction en trois dimensions d’un virion de la famille des Reoviridae, composée de virus à dsRNA segmentés, enfermés dans la capside. La synthèse d'ARN messagers est réalisée grâce aux TEC dont l’organisation avec le génome et le fonctionnement sont inconnus chez les virus à dsRNA. Grâce à des séries d’images de cryo-microscopie électronique, l’équipe a pu résoudre la structure tridimensionnelle du complexe dsRNA-TEC pendant la transcription et au repos. La cryo-microscopie électronique consiste à figer des particules, ici les virions, dans de l’éthane liquide, ce qui permet de les conserver dans leur état natif. L'observation en microscopie à transmission permet alors d’accéder à la structure interne des particules. Cette technique présente beaucoup moins de contraintes que la diffraction de cristaux sous rayons X.

Ils ont ainsi pu déterminer que les TEC sont composés de deux sous-unités : une ARN polymérase ARN-dépendante et une NTPase, toutes deux liées aux protéines constitutives de la capside. Une modélisation au niveau atomique des sites actifs de ces deux enzymes a permis d’expliquer comment un signal environnemental peut provoquer la transcription du genome viral : la capside s’agrandit et provoque un changement conformationnel de la polymérase, libérant son site actif.


Article #2


Article #3

Dans cet article [3], paru récemment dans BMC Bioinformatics, Xia Jin et son equipe nous présentent un tout nouvel outil qui nous permet de mieux appréhender l'ensemble des entrées de la base de donnée de protéines PDB. Cet outil porte le nom de PDB-Explorer. Ici, les scientifiques ont mis au point une sorte de carte interactive qui regroupe l'ensemble des données issues des structures 3D des protéines de la base de données PDB. Cette carte est visuellement très esthétique et très intuitive de par le code couleur qui a été choisi. En effet, on observe des groupements de couleurs différentes qui correspondent en fait à des groupes de protéines dont les structures sont proches. Ils y sont parvenus en établissant des comparaions des empreintes 3D des protéines. Ces empreintes ont été établies à partir des caractéristiques de leurs atomes. Le résultat de leur travail est disponible sur un site web très bien pensé et très visuel [4].



Dans cet article [5], paru récemment dans BMC Bioinformatics, Jackson Nowotny et son équipe nous présentent une méthodologie, nommée Gen3D, permettant la reconstruction 3D de l’ensemble des chromosomes humains. Cette reconstruction repose sur une modélisation initiale aléatoire de chaque chromosome. Ceux-ci sont alors passés à travers 3 algorithmes différents afin d’obtenir un ensemble de structures possibles pour chaque chromosome. La structure finale qui est choisie sera celle dont les scores seront les plus importants. Ces scores sont calculés à l’aide d’une matrice de contact (créée grâce à la technique Hi-C) qui résume les contacts intrachromosomiques pour chaque chromosome. Les scores sont alors les pourcentages de contacts ou de non-contacts satisfaits dans la modélisation par rapport à ceux répertoriés dans la matrice. Finalement, pour des cellules humaines saines ou malignes, ils obtiennent une modélisation des chromosomes avec des scores autour de 80% de contacts (ou non-contacts) satisfaits.


Article #4


Article #5

Dans cet article [6] publié dans Bioinformatics, les auteurs affirment que le coût d’un séquençage est désormais suffisamment bas pour être utilisé à des fins médicales de plus en plus communément, et les bases de données se remplissent de séquences issues directement de patients. Cependant, les données brutes s’accumulent et il est à présent nécessaire de les annoter afin de lier la pathogénicité d’un gène et les mutations qu’il comporte dans sa séquence. WGPA est né du constat qu’il n’existe aucun outil à l’heure actuelle capable de faire ce lien.

Cet outil combine trois approches qui vont évaluer la pathogénicité d’un gène en fonction d’un score. Celui-ci prend en compte le nombre de mutations observées, à la fois rares et communes, et le nombre de mutations qui ne seraient pas favorisées par l’évolution. La méthode a pour but de distinguer les mutations critiques des bénignes. WGPA peut réaliser cette analyse sur un seul gène mais aussi sur un ensemble de gènes. Ainsi l’outil va être capable de classer les gènes en fonction de leur score de pathogénicité et de former un réseau d’interactions. Ces prédictions sont étayées par des données issues d’analyses intéractomiques et de réseaux déjà connus.

En conclusion, WGPA est un outil robuste et simple d’utilisation grâce à une interface web intuitive qui a pour vocation d'analyser d’imposants jeux de données et d’identifier des gènes ou bien des réseaux de gènes impliqués dans des maladies.



L'apparition des technologies permettant le séquençage de génomes a provoqué la génération de données de tailles évoluant de manière exponentielle. Trier, traiter et analyser ces données est aujourd'hui un travail trop fastidieux sans l'outil informatique, outil pilier dans l'annotation des génomes séquencés. Juan Jimenez et son équipe présentent dans cet article [7] un nouveau programme informatique, AnABlast, capable via une stratégie d'accumulation d'alignement de séquences, d'ouvrir des perspectives nouvelles sur l'annotation des génomes. De par sa conception, AnABlast serait capable de détecter des pseudogènes, de nouveaux gènes, des séquences codantes, ainsi que des séquences codantes fossiles. Les exemples donnés dans l'article permettent d'apprécier les capacités et les limites de ce nouveau programme.


Article #6



Références Bibliographiques

  • [1] Guevara-Souza M., Vallejo E. E., A computer simulation model of Wolbachia invasion for disease vector population modification, BMC Bioinformatics. 16:317 (2015). doi:10.1186/s12859-015-0746-2.
  • [2] Zhang X., Ding K., Yu X., Chang W., Sun J., Hong Zhou Z., In situ structures of the segmented genome and RNA polymerase complex inside a dsRNA virus, Nature. (2015). doi:10.1038/nature15767.
  • [3] Jin X., Awale M., Zasso M., Kostro D., Patiny L., Reymond JL., PDB-Explorer: a web-based interactive map of the protein data bank in shape space, BMC Bioinformatics. 16:339 (2015). doi:10.1186/s12859-015-0776-9.
  • [4] PDB-Explorer, Jin X. Awale M., Zasso M., Kostro D., Patiny L., Reymond JL., http://www.cheminfo.org/pdbexplorer
  • [5] Nowotny J., Ahmed S., Xu L., Oluwadare O., Chen H., Hensley N., Trieu T., Cao R., Cheng J., Iterative reconstruction of three-dimensional models of human chromosomes from chromosomal contact data, BMC Bioinformatics. 16:338 (2015). doi:10.1186/s12859-015-0772-0.
  • [6] Diaz-Montana J. J. Rackham O., Diaz-Diaz N., Petretto E., Web-based Gene Pathogenicity Analysis (WGPA): A web platform to interpret gene pathogenicity from personal genome data, BioInformatics. (2015). doi: 10.1093/bioinformatics/btv598.
  • [7] Jimenez J., Duncan C. D. S., Gallardo M., Mata J., Perez-Pulido A. J., AnABlast: a new in silico strategy for the genome-wide search of novel genes and fossil regions, DNA Research. (2015). doi: 10.1093/dnares/dsv025.

Acronymes et Abréviations

  • ARN: Acide Ribo-Nucléique
  • dsRNA: double strand RNA / ARN double brin
  • TEC: Transcriptional Enzyme Complex
  • PDB: Protein Data Bank
  • Hi-C: High Chromosome Contact Map
  • WGPA: Web-based Gene Pathogenicity Analysis

Novembre 2015 | November 2015



Revue de presse, Novembre 2015

R. Anne, B. Baro, S. Besse, Q. Cavaillé, M. Lopez, A. Perdriau

Ce mois-ci, plusieurs articles ont retenu notre attention dans le domaine de l'immunologie avec un premier article tiré du magazine BioMedicalCentral et un second tout droit sorti de Briefings in Bioinformatics. Nous nous sommes également penchés sur les études bioinformatiques permettant de traiter des données issus de tissus tumoraux. Nous présentons donc trois articles issus de Journal of Bioinformatics. Nous terminons cette revue de presse par un second article provenant de BioMedicalCentral parlant de l'étude de séquences concensus.

Bonne lecture...


Article #1

Dans ce premier article [1] paru dans BioMedicalCentral, les auteurs expliquent qu'il existe des interactions assez complexes dans le fonctionnement cellulaire incluant l’ADN, l’ARN et les protéines. Des avancées dans le cadre de la génomique ont permis de faire des mesures massives, parallèles et impartiales et c’est dans cette optique que des chercheurs ont cru bon d’utiliser ces techniques de mesure dans l’étude des maladies humaines. Dans l’article sur lequel notre choix s’est porté, les cellules naïves CD4 et les cellules T isolées chez un individu sont étudiées et l’analyse multi-omic en est faite. L’analyse multi-omic des cellules naïves CD4 et des lymphocytes T a permis de voir de plus près l’expression des allèles dans celles-ci, l’effet de la méthylation du génome sur les modèles d’expression de la mRNA/protéines, et d’effectuer une étude comparative des cellules naïves et de celles qui sont en mémoires, permettant de voir les échanges moléculaires qui sont à la base de la différenciation cellulaire. Cette étude permet d’avoir un profil complet de deux types cellulaires humains provenant d’un seul donneur. En utilisant l’ensemble des techniques de séquençage, les chercheurs sont parvenus à donner une carte comparative de ces deux types de cellules immunes étroitement liées et d’identifier les effecteurs moléculaires potentiels de différenciation cellulaire qui sont immunisés après la rencontre de l’antigène.


Toujours concernant le domaine de l'immunologie, cette fois dans le journal Briefings in Bioinformatics [2], Bernard Knapp et ses collaborateurs publient un article traitant de l'interaction entre TCR[cf] / peptide / MHC[cf]. Leur interaction serait à l'origine de l'activation des lymphocytes T, acteurs principaux de l'immunité cellulaire. L'analyse de l'interaction de ces deux complexes se fait en général par cristallographie aux rayons X, mais il est également possible de réaliser des études in vitro de cette interaction par la technique de simulation de dynamique moléculaire. Cela permet d'observer la configuration structurale du complexe moléculaire et ses mouvements au cours du temps. De nombreuses publications relatent de ce type d'études, c'est pourquoi les auteurs ont cherché à les comparer pour les classer en fonction des différentes configurations étudiées. Suite à ces analyses, ils ont pu conclure de l'intérêt de chacune de ces études et ont pu ainsi mettre en avant les points à améliorer (nombre d'échantillons à étudier, étude sur la synapse immunologique entière). L'étude de l'interaction TCR/peptide/MHC est primordiale dans la recherche pour trouver des solutions afin de traiter le cancer, les maladies auto-immunes ou les allergies. La connaissance du mécanisme d'interaction permettrait de concevoir des peptides et TCR personnalisés pour mieux cibler ces maladies.

Article #2


Article #3

Nous allons maintenant voir un article[3] paru dans le journal BioInfomatics traitant des ET[cf] des génomes eucaryotes. Les génomes eucaryotes possèdent des éléments transposables c'est à dire des portions capables de se déplacer à l'intérieur de ce génome. Si la plupart des ces éléments ne sont pas fonctionnels certains sont toujours capables d'étre transcrits. Malheureusement, ils sont ignorés dans la plupart des analyses car ils se trouvent généralement dans des zones hautement répétées du génomes qui sont difficilement séquençables. L'article détaille le fonctionnement de TEtranscripts. Il charge ses données à partir de fichier BAM/SAM et GTF[cf], et lorsqu'il y a ambiguité établit un profil d'expression de l'ET afin de déterminer son existence. Il a également été comparé à d'autres systèmes de détection d'ETs (RepEnrich notamment), et semble être bien plus efficace que ces derniers.


Dans cet article [4] publié ce mois-ci en ligne, les auteurs expliquent le travail qu'ils ont réalisé afin d'améliorer les techniques d'annotation des variants. Les techniques classiques permettent d'annoter les variants avec précision uniquement dans le cas où ils font partie de région à forte cartographiabilité. Dans le cas contraire, les faux négatifs peuvent représenter jusqu'à 10% des variations totales.
Une technique complémentaire, appelée Thesaurus annotation permet de lier ces régions à faible cartographiabilité avec des locis alternatifs. Par symétrie et transitivité les sites se regroupent, ces groupes formeront la base de toute comparaisons, interprétations ou analyses. Les auteurs ont donc décidé d'améliorer l'approche Thesaurus en améliorant la détection des modifications de l'ADN au travers d'échantillons appariés c'est à dire qu'ils implémentent une stratégie de filtrage personnalisée.

Article #4


Article #5

Restons dans la même thématique avec cet article[5]. Les auteurs ont développé un nouvel algorithme InfiniumPurify permettant d'évaluer le niveau de pureté d'un échantillon tumoral à partir de données portant sur la méthylation d'ADN issues de micro-array. Auparavant d'autres algorithmes et logiciels ont été développés dans l'optique d'évaluer la pureté des tissus tumoraux ,ceux ci reposaient sur l'analyse du nombre de variant ou l'analyse de mutations ponctuelles. L'algorithme proposé par les auteurs repose sur la base d'un constat biologique simple qui est que, les cellules saines présentent un niveau de méthylation différent de celui des cellules cancéreuses.L'algorithme développé applique une série de calculs et tests statistiques sur les données issues de micro-array permettant ainsi l'estimation de la pureté tumorale sur des tissus mixtes composés à la fois de cellules saines et cancereuses présentant de ce fait un niveau de méthylation moyen. Cette approche novatrice couplée à l'algorithme développé représente une alternative sérieuse aux solutions employées jusqu'à présent dans le domaine et présenterait l'avantage, aux dires des auteurs d'être plus facile et moins onéreuse à mettre en place que ces dernières.


Un article de BMC Bioinformatics pour terminer [6]. Les séquences consensus étant de plus en plus étudiées, l'utilisation des visualisations suivant le principe des logos s'est ainsi multipliée et le nombre de motifs publiés a alors augmenté. Aujourd'hui, il est de plus en plus difficile de déceler alors les différences existantes à partir de ce type de visualisation. Difflogo est un package R, conçu par l'équipe allemande de Martin Nettling basé sur un principe de calcul stochastique, qui permet une analyse visuelle intuitive des différences de motifs, en utilisant la représentation des logos de séquence.

Article #6



Références Bibliographiques

  • [1] Christopher J. Mitchell, Derese Getnet, Min-Sik Kim, Srikanth S. Manda, Praveen Kumar, Tai-Chung Huang, Sneha M. Pinto, Raja Sekhar Nirujogi, Mio Iwasaki, Patrick G. Shaw, Xinyan Wu, Jun Zhong, Raghothama Chaerkady, Arivusudar Marimuthu, Babylakshmi Muthusamy, Nandini A. Sahasrabuddhe, Rajesh Raju, Caitlyn Bowman, Ludmila Danilova, Jevon Cutler, Dhanashree S. Kelkar, Charles G. Drake, T. S. Keshava Prasad, Luigi Marchionni, Peter N. Murakami, Alan F. Scott, Leming Shi, Jean Thierry-Mieg, Danielle Thierry-Mieg, Rafael Irizarry, Leslie Cope, Yasushi Ishihama, Charles Wang, Harsha Gowda and Akhilesh Pandey, A multi-omic analysis of human naïve CD4+ T cells, BMC Systems Biology 9:75 (2015). doi : 10.1186/s12918-015-0225-4
  • [2] B. Knapp, S.Demharter, R. Esmaielbeiki and C. M. Deane, Current status and future challenges in T-cell receptor/peptide/MHC molecular dynamics simulations, Briefings in Bioinformatics 1035–1044 (2015). doi : 10.1093/bib/bbv005
  • [3] Y. Jin, O. H. Tam, E. Paniagua and M. Hammel, TEtranscripts : a package for including transposable elements in differential expression analysis of RNA-seq datasets, Bioinformatics 3593-9 (2015). doi : 10.1093/bioinformatics/btv422
  • [4] Konopka Tomasz and Sebastian M.B. Nijman, Comparison of genetic variants in matched samples using thesaurus annotation. First published online: November 5, 2015 doi : 10.1093/bioinformatics/btv654
  • [5] Naiqian Zhang, Hua-Jun Wu,Weiwei Zhang, Jun Wang,Hao Wu, Xiaoqi Zheng - Predicting tumor purity from methylation microarray data, Bioinformatics 3401-3405 (2015). doi : 10.1093/bioinformatics/btv370
  • [6] Nettling M., Treutler H., Grau J., Keilwagen J., Posch S., Grosse I. , DiffLogo : a comparative visualization of sequence motifs, BMC Bioinformatics 16:387 (2015). doi : 10.1186/s12859-015-0767-x

Acronymes et Abréviations

  • TCR : T-cell receptor
  • MHC : Major Histocompatibility Complex
  • ET : Element Transposable
  • GTF : Gene Transfer Format

Décembre 2015 | December 2015



Revue de presse, Décembre 2015

P. Bonneau, F. Ceril, D. Coudrin, K. Jamart, T.A Trinh

Ce mois-ci dans notre revue de presse, des articles traitant de thèmes différents, à commencer par du dessin de graphe avec un article tiré de Bioinformatics. Celui-ci nous présente un algorithme de représentation de réseaux biologiques avec le standard SBGN. Ensuite une méthode permettant l'amélioration des criblages phénotypiques pour la recherche de nouveaux médicaments, méthode décrite dans un article de Nature Biotechnology. Le troisième article que nous avons choisi, issu de BMC Bioinformatics traite lui de phylogénie, plus précisément d'un outil Treelink, permettant leur visualisation mais également l'intégration de données et la réalisation d'analyses comparatives. Un autre article que nous avons sélectionné, lui aussi paru dans BMC Bioinformatics, nous présente une plateforme, Pathosphere.org, facilitant l'accès aux données et aux outils NGS pour la détection et la caractérisation de pathogènes, et réalise un test de celle-ci. Enfin notre cinquième article présente MICC, un package R pour la détection d'interactions avec la chromatine depuis des données de séquençage ChIA-PET.

Bonne lecture !


Article #1

Cet article[1] paru dans le Oxford journal écrit par Begum Genc et Ugur Dogursoz nous explique l'amélioration d'un algorithme pour la représentation de SGBN-PD.
Le SBGN est un standard permettant la représentation de graphes biologiques. L'une de ces représentations, le Process Description (PD), ne possède pas de layout automatique qui respecte entièrement ces conventions. Les auteurs se basent sur un algorithme qu'ils ont déjà développé, CoSE, afin qu'ils appliquent les conventions SBGN-PD. CoSE est un Force directed Layout qui simule un système physique respectant les lois de Hooke et Coulomb et positionne les noeuds et leurs arêtes. L'amélioration de cet algorithme permet l'ajout de nouveaux ports d'entrée et de sortie sur les noeuds de réactions, évitent les croisement d'arêtes en appliquant des rotations et en regroupant les noeuds et permet la représentation de composé cellulaire. De plus, l'amélioration de CoSE ne le ralentit pas et permet d'améliorer significativement la représentation SBGN-PD.


Dans cet article[2] paru dans Nature Biotechnology, une équiqe du Green Center for Systems Biology (UT Southwestern Medical Center, Dallas, Texas) nous présente une méthode pour améliorer l'efficacité et la précision des criblages phénotypiques. L'enjeu ici est de découvrir de nouveaux médicaments, par exemple pour réduire les effets secondaires de chez des sous-groupes de patients, ou qui peuvent développer des résistances au traitement. Le point central lors de la recherche de nouveaux composés chimiques par criblage basé sur l'imagerie, est le choix du meilleur biomarqueur possible. Celui-ci permettra de surveiller les réponses du système au niveau de chaque cellule. Cependant peu de biormarqueur peuvent être gérés en même temps lors de l'observation des cellules par microsopie à fluorescence. De plus, il n'existe pas encore d'ensemble minimal de biomarqueurs permettant une classification précise des composés testés parmi des classes de médicaments. Ici, les auteurs vont constituer une bibliothèque de lignées de cellules rapporteuses (vivantes, avec différents tag fluorescents pour une large varieté de fonction biologiques). Après analyse de ces lignées cellulaires, celle présentant les profil phénotypique permettant de classer le mieux des composés testés sont identifiées. C'est l'ORACL.

Article #2


Article #3

Treelink[3] comme son semblable, la plateforme Phylogenie.fr, a été développé dans le cadre de l’analyse et la comparaison des données en terme de phylogénie. S’appuyant aussi sur un modèle de classification connu, Le cladogramme, à l’aspect d’un arbre, et qui classe les données attribuées sur une relation de parenté.
Les séquences à comparer peuvent être de nature génomique ou protéomique, de plus pour simplifier amplement la structure des arbres et afficher le maximum de divergences, des nouveaux clades ont été ajoutés. Aussi des informations géographiques intégrées permettent à partir d’un caractère ancestral un traçage phylogéographique basé sur des algorithmes de parcimonie et de vraissemblance.


Dans cet article [4] paru dans la revue BMC Bioinformatics, nous est présenté un site internet récent, Pathosphere (disponible à Pathosphere.org). Ce site a pour but de mettre à disposition des biologistes et bioinformaticiens des outils d'analyse de données obtenues via du séquençage nouvelle génération (en leur fournissant les ressources matérielles et logicielles via une interface web), afin de détecter la présence de possibles pathogènes dans un échantillon analysé en comparant les résultats à différentes bases de données (ex: NCBI). Cette démarche s'inscrit dans un cadre communautaire, permettant le partage de ces outils d'analyse et de données de séquençage nouvelle génération par des scientifiques de tous milieux (gouvernements, industries, enseignement), et fournit à l'utilisateur des résultats aisés à traiter et à analyser. De plus, le mode de fonctionnement du site (de type cloud) facilite les collaborations et le partage d'informations, le site disposant d'un forum et d'autres outils de communications entre utilisateurs.


Article #4


Article #5

MICC: an R package for identifying chromatin interactions from ChIA-PET data[5].
ChIA-PET est une technologie d'étude de la chromatine. Elle repose sur l'immunoprecipitation de la chromatine, et permet d'avoir des informations sur les intéractions chromatiniennes à longue distance. C'est une technologie récente de haut débit pour laquelle les méthodes d'analyses sont peu nombreuses à l'heure actuelle. En effet deux méthodes sont utilisées ChIA-PET tool et ChiaSig. La méthode ChIA-PET tool ne permet pas une gestion du bruit satisfaisant et ne rend pas compte des certaines intéractions faibles, tandis que ChiaSig bien que gérant mieux le bruit engendre de nombreux faux positifs au cours de l'analyse. MICC propose une nouvelle alternative reposant sur la formation de cluster séparés. Ces clusters seront traités avec des tests statistiques différents suivant leur nature. Les résultats montre une amélioration sur à réduction du bruit et permet une meilleure reproductivité des analyses.



Références Bibliographiques

  • [1] Begum Genc and Ugur Dogrusoz : An algorithm for automated layout of process description maps drawn in SBGN doi: 10.1093/bioinformatics/btv516
  • [2] Jungseog Kang, Chien-Hsiang Hsu, Qi Wu, Shanshan Liu, Adam D. Coster, Bruce A. Posner, Steven J. Altschuler & Lani F. Wu : Improving drug discovery with high-content phenotypic screens by systematic selection of reporter cell lines doi:10.1038/nbt.3419
  • [3] Christian Allende, Adolfo Ibañez, Erik Sohn and Cedric Little : Treelink: data integration, clustering and visualization of phylogenetic trees doi : 10.1186/s12859-015-0860-1
  • [4] Kilianski et al., Pathosphere.org: pathogen detection and characterization through a web-based, open source informatics platform. BMC Bioinformatics (2015). doi: 10.1186/s12859-015-0840-5
  • [5] Chao He, Michael Q. Zhang and Xiaowo Wang : MICC: an R package for identifying chromatin interactions from ChIA-PET data doi: 10.1093/bioinformatics/btv445

Acronymes et Abréviations

  • SBGN : Systems Biology Graphical Notation
  • CoSE : Compound Spring Embedded
  • ORACL : Optimal Reporter cell lines for Annotating Compound libraries
  • ChIA-PET : Chromatin Interaction Analysis by Paired-End Tag Sequencing
  • MICC : Model based Interaction Calling from ChIA-PET data

Février 2016 | February 2016



Revue de presse, Février 2016

S. Huttinet, F. Lassalle, L. Leaute, L. Perus, A. Yahou

Bonjour à tous, et bienvenue pour cette revue de presse du mois de février. Vous trouverez dans cette section une sélection d'articles qui nous ont paru intéressants ce mois-ci. En vous souhaitant une excellente lecture de cette sélection mensuelle !



Article #1

Dans cet article publié ce mois-ci dans Scientific Reports[1], les auteurs présentent un nouveau site internet permettant de prédire et de comprendre les effets de recettes médicinales ancestrales chinoises. Le but est de pouvoir prédire les voies métaboliques et les couples liguands-récepteurs mis en jeu lors des traitements avec ces remèdes. Le monde de la recherche pharmaceutique s'intéresse de plus en plus à la médecine ancestrale chinoise car elle est relativement efficace et encore peu étudiée, elle présente donc un certain potentiel pour la conception de nouveaux médicaments. C'est donc dans ce sens que vont les auteurs en proposant un outil permettant de simplifier l'approche et la compréhension de ces remèdes.



Dans leur étude publiée dans nature[2] le 11 février 2016 de Darren J.Baker et son équipe ont cherché à déterminer le rôle joué par les cellules sénescentes dans le processus de vieillissement global des tissus.
Leurs experiences effectuées sur des populations de souris visaient à induire l'apoptose des cellules sénescentes à l'aide d'injections d'une drogue AP20187 et d'un transgène (INK-ATTAC). Ils comparent ensuite statistiquement la survie des lots de souris témoins non traitées à celle des souris traitées.
Leurs analyses ont montrées une augmentation de la durée de vie des souris et une diminution des pathologies liées à l'âge significative après suppression des cellules sénescentes et ce sans effet négatifs secondaires. Selon eux c'est l'expression de la protéine p16Ink4a et les différentes mollécules secrétées par les cellules sénescentes dans leur milieu qui entraîneraient un vieillissement prématuré des tissus.

Article #2


Article #3

Les récentes recherches pour comprendre pleinement les différentes mutations dans divers type de cancer ont révélé que les processus de mutation peuvent être extrêmement variable selon le type de tumeur et les caractéristiques cliniques des patients.
C'est pourquoi dans cet article, paru dans BMC Bioinformatics[3], les auteurs nous présente LowMACA, un package R , disponible aussi sous forme d'application.
Il permet l'analyse des profils de mutations de protéines partageant des domaines spécifiques. En alignant ces séquences protéiques, celui-ci donnerait l'identification des mutations dans plusieurs alignements de séquence et de les évaluer statistiquement.
Son but final est donc l'identification de mutation affectant des familles de gènes ayant un rôle pour un type de tumeur.



Le (microbiote) d'un organisme est primordiale à son développement, et peut être à l'origine de troubles importants.
Dans cet article[4], publié dans Briefings in Bioinformatics, les auteurs présentent un modèle associatif microbiotes-maladies qu'ils ont développé. Après s'être documentés dans la littérature, et avoir établi les microbiotes spécifiques à 39 maladies humaines, ils ont implémenté une base de données microbiote-maladies[5], et déterminé les liens entre ces différentes maladies. Ils ont par la suite superposé à ce modèle d'autres modèles reliant les maladies en fonction de leurs gènes, composés chimiques, symptômes et traitements communs. Des similitudes entre ces modèles et le leur ont été observées.

D'autre part, afin de tester la pertinence de leur modèle, les auteurs ont également comptabilisé le nombre de liens qui leur semblaient pertinents pour comparer leur nombre à celui de ceux qui semblaient incohérent. Il en ressort que le modèle est globalement cohérent.

Ce nouveau type de modèle pourrait ainsi permettre, en étant associé à d'autre modèles tels que ceux cités ci-dessus, d'émettre des hypothèses pertinentes liées aux problèmes de santé ou aux mécanismes biologiques encore méconnus.

Article #4


Article #5

Cet article publié dans la revue Bioinformatics [6] traite du sujet des bases de données. Il nous présente les particularités de la base de donnée pharmacologique (PDID).
De nombreuses bases de données pharmacologiques sont déjà disponibles, elles répertorient les différentes molécules thérapeutiques ainsi que leurs cibles connues et les associent aux pathologies concernés. Parmi ces bases de données il y’a DurgBank, Therapeutic Target Database, BindingDB et bien d’autres. Néanmoins ces bases de données ne font qu’apporter des informations sur des molécules thérapeutiques et leurs interactions avec des cibles, confirmées par des études expérimentales. Il existe cependant de nombreuses autres interactions entre les molécules thérapeutiques et des cibles non attendus, ces interactions potentiels représentent un avantage considérable qui permet d’envisager de nouveau traitements.
A cet effet la base de donnée PDID donne une liste d’interactions possible d’une molécule thérapeutiques connues avec d’autres cibles que celles qu’on lui connais déjà. Les interactions possibles du médicament sont évaluées avec l’ensemble du protéome humain grâce à trois méthodes de prédiction: ILbind, SMAP et eFindSite..




Références Bibliographiques

  • [1] Zhongyang Liu, Feifei Guo, Yong Wang, Chun Li, Xinlei Zhang, Honglei Li, Lihong Diao, Jiangyong Gu, Wei Wang, Dong Li , Fuchu He BATMAN-TCM: a Bioinformatics Analysis Tool for Molecular mechANism of Traditional Chinese Medicine doi:10.1038/srep21146
  • [2] Darren J. Baker, Bennett G. Childs, Matej Durik, Melinde E. Wijers, Cynthia J. Sieben, Jian Zhong, Naturally occurring p16Ink4a-positive cells shorten healthy lifespan, Nature, Feb 3, 2016 doi:10.1038/nature16932
  • [3] Melloni GE., de Pretis S., Riva L., Pelizzola M., Céol A., Costanza J., Müller H., Zammataro L. LowMACA: exploiting protein family analysis for the identification of rare driver mutations in cancer doi:10.1186/s12859-016-0935-7
  • [4] Wei MaLu, ZhangPan Zeng, Chuanbo Huang, Jianwei Li, Bin Geng, Jichun Yang, Wei Kong, Xuezhong Zhou, Qinghua Cui doi:10.1093/bib/bbw005
  • [5] www.cuilab.cn.
  • [6] Chen Wang, Gang Hu, Kui Wang, Michal Brylinski, Lei Xie and Lukasz Kurgan. Department of Electrical and Computer Engineering, University of Alberta, Edmonton, AB, Canada T6G 2V4, School of Mathematical Sciences and LPMC, Nankai University, Tianjin 300071, People’s Republic of China, Department of Biological Sciences, Louisiana State University, Baton Rouge, LA 70803, USA, Department of Computer Science, Hunter College, City University of New York (CUNY), New York, NY 10065, USA and Department of Computer Science, Virginia Commonwealth University, Richmond, VA 23284, USA. doi: 10.1093/bioinformatics/btv597

Acronymes et Abréviations

  • PDID: Protein-Drug Interaction Database
  • Microbiote : Ensemble des micro-organismes dans un environnement spécifique

Mars 2016 | March 2016



Revue de presse, Mars 2016

J.Estebeteguy, J.Hardy, K.Jlassi, F.Ndao, F.Lefebvre

Bonjour, et bienvenue pour cette revue de presse du mois de mars. Vous trouverez dans cette section une sélection d'articles qui nous ont paru intéressants ce mois-ci. En vous souhaitant une excellente lecture de cette sélection mensuelle !



C'est dans un numéro spécial dédié au CRISPR-Cas9 publié dans nature[1] que mon article a été sélectionné. Il a été publié le 1 octobre 2015 et réalisé par Luciano A.Marraffini. Dans cette revue, plusieurs scientifiques se sont penchés sur cette récente technique de modification du génome. Cet arcticle traite de l'immunité des procaryotes à l'aide du système CRISPR-Cas.
Les organismes procaryotes sont menacés par de nombreux types de virus et ont donc développé de nombreuses stratégies de défense. Parmi ces organismes procaryotes, uniquement certains clusters, les systèmes CAS-(CRISPR) correspondant à de courtes répétitions en palindrome regroupées et régulièrement espacées fournissent l'immunité adaptative contre des éléments étrangers.
Lors de l'injection virale, une petite séquence du génome provenant d'un virus, connu comme un espaceur( c'est à dire une séquence d'ADN non transcrit, séparant les gènes à l'intérieur des unités répétées), est intégré au sein du locus du CRISPR pour immuniser la cellule hôte. Les espaceurs sont transcrits en petit ARN guides qui dirigent le clivage de l'ADN viral par des nucléases Cas.L'immunisation par l'acquisition d'espaceurs permet une forme unique de l'évolution selon laquelle une population acquiert non seulement rapidement une résistance à ses prédateurs, mais transmet également ce mécanisme de résistance à la descendance.

Article #1


Article #2

Les récentes avancées technologiques permettent maintenant la collection de vastes ensembles de données détaillant les motifs de connectivité neuronaux complexes de divers organismes. Oh et al. (2014 )[2] ont récemment publié la description la plus complète du connectome mesoscale de la souris acquise à ce jour. Cet article[3], publié ce mois dans Elife[4], donne une caractérisation en profondeur de ce connectome et propose un modèle génératif de réseau qui utilise deux principes organisationnels élémentaires : fixation proximal - les connexions sortantes sont plus susceptibles de joindre à des noeuds voisins que de ceux éloignés, et la croissance de la source - nœuds avec de nombreux sortants les connexions sont susceptibles de former de nouvelles connexions sortantes. On essaye de montrer que ce modèle capture les principes essentiels régissant l'organisation du réseau au niveau méso-échelle dans le cerveau de souris et qu’il est compatible avec les processus de développement biologiquement plausibles.



Cet article publié le 22 Mars dans la revue BMC Bioinformatics [5] par des auteurs chinois Bo Yang, Yong Wang et Pei-Yuan Qian. Il se porte sur l'utilisation des outils bioinformatics enfin de determiner les regions de l' ARNr 16s impliqué dans l'analyse phylogenetique des microorganismes.
Les séquences d'ARN ribosomique 16s des procaryotes sont fortement utilisés dans le domaine de la microbiologie ainsi que dans l'evolution moléculaire en tant que marqueurs fiables pour la classification taxonomique et l'analyse phylogénétique des microorganismes.Les techniques actuelles de séquençages ne permettent pas le séquençage massif des amplicons des gènes d'ARNr 16s du fait de leurs très grandes longueurs.De ce fait, la sélection des régions hypervariables pour l'analyse phylogénétique et la classification taxonomique est encore en plein débat.
Dans cette étude, plusieurs outils bioinformatiques ont été intégré afin de construire des pipelines in silico pour évaluer la sensibilité phylogénétique des régions hypervariables comparé à la totalité de la séquence. Les résultats ont montré une corrélation entre sept sous-régions, grace au calcul de la distance géodesique. Ce paramètre est appliqué pour comparer quantativement la topologie des différents arbres phylogénétiques construits à partir de séquences des différentes sous-régions. Les calculs révélent que les régions hypervariables V4-V6 sont les régions les plus fiables pour représenter la totalité de la sequence d'ARNr 16s dans l'analyse phylogénétique de la plupart des phyla des bactéries, alors que V2-V8 sont les régions les moins fiables.

Article #3


Article #4

Cet article, paru le 29 Mars 2016 dans la revue Bioinformatics[6], traite d'une nouvelle bibliothèque Javascript, pileup.js. Celle-ci propose une visualisation par navigateur des données génomiques. Son but est ainsi essentiellement de faciliter la recherche de variants génomiques.
En effet, incorporer ces données dans une large application web entraînerait une diminution des délais et autoriserait des réglages poussés. Pileup.js en est actuellement à la version v0.6.1., et supporte le tracking sur des séquences références, l'annotation des gènes, ou les mapped reads, qu'ils soient appareillés ou non.



Dans cet article publié au mois de mars dans Scientific Reports[7], les auteurs présentent un comparatif des protéines connues des cinq membres du genre Ebolavirus(virus Ebola, virus Soudan, les virus Bundibugyo, virus Taϊ forestiers et virus Reston) pour permettre la mise évidence de leurs ressemblances et de leurs différences. Le but est de comprendre pourquoi quatre membres du genre Ebolavirus sont pathogènes aux humains contrairement au dernier, les virus Reston. En effet les différences de pathogénicité humaine entre celui-ci et les autres membres du genre Ebolavirus restent floues. Les auteurs ont effectué une analyse in silico (recherche effectué au moyen de calculs complexes informatisés ou de modèles informatiques) des différences génomiques au niveau des protéines entre les virus Reston et autres Ebolavirus pour identifier les changements. Ils ont également fait une analyse structurale des protéines pour visualiser les différences. Le virus Ebola cause des fièvres hémorragiques et un taux de mortalité pouvant atteindre 90% pourtant il existe encore des zones d'ombre sur le sujet. Les auteurs s'interrogent également sur le risque d'éventuelle mutation des virus Restons, présent chez le porc, le rendant pathogène pour les humains.


Article #5



Références Bibliographiques

  • [1] Luciano A. Marraffini,CRISPR-Cas immunity in prokaryotes, Nature 526, 55–61, 2015. DOI: 10.1038/nature15386
  • [2] SW Oh, JA Harris, L Ng, B Winslow, N Cain, S Mihalas, A mesoscale connectome of the mouse brain, Nature, 508, 207-214, 2014, http://DOI:dx.doi.org/10.1038/nature13186
  • [3]Sid Henriksen, Rich Pang, Mark Wronkiewicz,A simple generative model of the mouse mesoscale connectome, eLIFE March 15, 2016 DOI:10.7554/eLife.12366
  • [4] http://elifesciences.org/
  • [5] Bo Yang, Yong Wang and Pei-Yuan Qian, Sensitivity and correlation of hypervariable regions in 16S rRNA genes in phylogenetic analysis, BMC Bioinformatics, 2016 DOI:10.1186/s12859-016-0992-y
  • [6] Dan Vanderkam, B. Arman Aksoy, Isaac Hodes, Jaclyn Perrone and Jeff Hammerbacher, pileup.js: a JavaScript library for interactive and in-browser visualization of genomic data, Bioinformatics (2016). DOI:10.1093/bioinformatics/btw167
  • [7] Morena Pappalardo , Miguel Juliá , Mark J. Howard, Jeremy S. Rossman, Martin Michaelis, Mark N. Wass. Conserved differences in protein sequence determine the human pathogenicity of Ebolaviruses.doi:10.1038/srep23743

Acronymes et Abréviations

  • CRISPR: Clustered Regularly Interspersed Palindromic Repeats

April 2016 | April 2016



Revue de presse, Avril 2016

K. Kastano, A. Larpent, A. Petit, T. Riquelme, A. Souvane

Pour la revue de presse du mois d'avril, nous avons sélectionné pour vous des articles des plus intéressants. Du tout nouveau génome minimal ayant été découvert, en passant par des techniques visant à lutter contre maladies et addictions, jusqu'au nouveau logiciel permettant de programmer une cellule, nous aurons le plaisir ce mois-ci de vous présenter et partager avec vous nos découvertes.



Mycoplasma genitalium est l'organisme avec le plus petit génome présent dans la nature et pourtant les chercheurs ont prouvé que même ce génome contient des gènes non essentiels pour sa survie. Dans cet article paru dans Science [1] au mois de mars, les auteurs présentent leur travail qui a abouti à la création d'une cellule du genre Mycoplasme (M.mycoides) avec un génome synthétique qui est encore plus petit que celui de M. genitalium.
En 2010, l'équipe a tenté une première fois de dessiner un génome minimal, le HMG en se basant sur de la littérature et des données limitées de la technique appelée mutagénèse de transposon. Cette technique permet de détecter les gènes non-essentiels pour la survie d'une cellule. En fait, les gènes qui sont perturbés par les insertions du transposon sans compromettre la viabilité de la cellule sont considérés comme non essentiels. Ce travail n'a pas produit de résultats mais leur a permis d'améliorer leur technique de synthèse d'ADN et la détection des gènes non-essentiels et des gènes quasi-essentiels (des gènes non-essentiels mais importants pour la croissance des cellules). Ils ont ainsi réussi à produire une cellule avec un génome minimal, la JCVI-syn3.0.
Contre toute atteinte, 17% des gènes de ce génome minimal a des fonctions biologiques inconnues qui pourraient correspondre à des fonctions essentielles pour la vie encore à découvrir.

Article #1


Article #2

Mycobacterium tuberculosis est la bactérie responsable de la tuberculose. Des millions de personnes meurent chaque année de cette maladie. Il est donc crucial de trouver un remède.
Cet article publié sur PLoS One [2] présente un portail web développé afin d'aider la recherche luttant contre des souches émergentes Mtb en utilisant des approches traditionnelles et modernes. Une cinquantaine de génomes d'espèces de Mycobacterium ont été annoté pour comprendre les similitudes et les différences entre tuberculoïdes et souches vaccinales non tuberculoides. Des candidats de vaccins à base d'antigène ont été prédit dans chaque souche ainsi que des vaccins à base d'épitopes. A partir de ces candidats, une base de données à été développé pour les souches Mtb. Le serveur intègre trois modules d'identification différents: un pour les souches, un pour les antigènes et le dernier pour les candidats des vaccins spécifiques d'épitopes.
Ce portail web se veut utile pour les chercheurs travaillant sur ​​la conception de vaccins contre la tuberculose y compris les souches résistantes aux médicaments.


Des millions de personnes dans le monde souffrent de maladies qui conduisent à la paralysie à cause d'une coupure dans les voies de signalisation entre le cerveau et les muscles.
Dans leur étude publiée dans Nature[3] au mois d'avril, les auteurs expliquent comment ils ont conçu une neuroprothèse pour restaurer les fonctions perdues en formant une "dérivation neurale électronique" pour contourner les voies déconnectées du système nerveux.
Pour cela, ils ont utilisé une puce à microélectrodes implantée dans la zone motrice du cortex pour mesurer l'activité de cette zone chez un patient tétraplégique souffrant d'une lésion de la zone cervicale de la colonne vertébrale. Ensuite, ils ont utilisé des algorithmes d'apprentissage-machine pour décoder l'activité neuronale et contrôler l'activation des muscles de l'avant-bras du sujet à travers un sytème de stimulation neuromusculaire électrique à haute résolution.
Ce système a permis au sujet de faire des mouvements de doigts isolés ainsi que six mouvements différents de la main et du poignet lui conférant la capacité d'attraper, de manipuler et de relacher les objets.
C'est la première démonstration connue d'un contrôle réussi de l'activation musculaire utilisant des signaux intracorticaux chez un patient humain paralysé. Ces résultats pourraient conduire au développement de nouvelles neuroprothèses pour les personnes dans le monde vivant avec les effets de la paralysie.

Article #3


Article #4

Dans cet article publié dans Science Magazine[4] le 1er avril 2016, l'équipe du Professeur Christopher Voigt présente son nouveau logiciel CELLO (également disponible en ligne[5]) capable de générer une séquence ADN. Cette séquence ADN n'est pas n'importe laquelle, c'est celle dont vous aurez défini vous-même les fonctions au préalable. Vous construisez et insérez la séquence ADN dans une cellule et cette dernière sera capable de l'interpréter et ainsi répondre aux fonctions que vous aurez choisi!
Imaginez dans un futur travail, que vous souhaitiez avoir une cellule capable de détecter une forte concentration d'arabinose dans son environnement, et qui en réponse produira un chromophore. Il vous suffit alors de décrire la fonction du circuit grâce au langage Verilog[6], et de fournir au logiciel le promoteur entrant qui détecte la présence d'arabinose et le gène sortant qui produira le chromophore, ainsi qu'un "User Constraints File" (UCF). Le logiciel va alors parser le programme Verilog, lancer une suite d'algorithmes, pour finalement vous fournir la séquence ADN qui répondra à vos besoins.
Grâce à ce programme, l'équipe a ainsi réussi à concevoir 60 circuits pour la bactérie E.Coli, générant 60 séquences ADN qui ont été construites et insérées dans une cellule. Sur ces 60 circuits, 45 circuits fonctionnaient correctement dans tous leurs états sortants. Et considérant l'ensemble des circuits, 92% des 412 états sortants fonctionnaient comme le programme l'avait prédit.


De nombreuses données d'expression génique de traitement de la toxicomanie ont été généré dans le but d'identifier des biomarqueurs prédictifs de la toxicité ou de classer les composés. Cependant, ces modèles sont souvent très variables selon les composés et manquent de robustesse.
Dans cet article publié dans Database(Oxford University Press)[7] le 13 Avril, les auteurs présentent une base de données: ToxDB(disponible en ligne[8]), pour l'analyse des conséquences fonctionnelles de traitement de la toxicomanie au niveau des voies moléculaires. ToxBD utilise les profils d'expression de gènes à partir de cellules traitées par un médicament et combine cette information avec des données d'interaction des modules pour déterminer les gènes, les filières et les réseaux qui sont les plus touchés par un médicament donné.
ToxDB est donc une interface Web qui fournit de nombreuses fonctionnalités qui permettent l'exploration des différents aspects des données de traitement de la toxicomanie pour un médicament donné. Ainsi, les auteurs expliquent le fonctionnement de cette interface Web. Les données présentées permettent aux chercheurs de déterminer les mécanismes et le degré de réponses cellulaires de drogue induite

.

Article #5



Références Bibliographiques

  • [1] Clyde A. Hutchison III, Ray-Yuan Chuang, Vladimir N. Noskov, Nacyra Assad-Garcia, Thomas J. Deerinck, Design and synthesis of a minimal bacterial genome, Science, Vol. 351, Issue 6280, 2016. DOI:10.1126/science.aad6253
  • [2] Dhanda SK, Vir P, Singla D, Gupta S, Kumar S, Raghava GP. A Web-Based Platform for Designing Vaccines against Existing and Emerging Strains of Mycobacterium tuberculosis, PLos One, 2016 Apr 20. DOI:10.1371/journal.pone.0153771
  • [3] Chad E. Bouton, Ammar Shaikhouni, Nicholas V. Annetta, Marcia A. Bockbrader, David A. Friedenberg, Dylan M. Nielson, Gaurav Sharma, Per B. Sederberg, Bradley C. Glenn, W. Jerry Mysiw, Austin G. Morgan, Milind Deogaonkar, Ali R. Rezai, Restoring cortical control of functional movement in a human with quadriplegia, Nature, 2016. doi:10.1038/nature17435
  • [4] Alec A. K. Nielsen, Bryan S.Der, Jonghyeon Shin, Prashant Vaidyanathan, Vanya Paralanov, Elizabeth A. Strychalski, David Ross, Douglas Densmore, Christopher A. Voig, Genetic circuit design automation, Science 01 Apr 2016, Vol. 352, Issue 6281, DOI: 10.1126/science.aac7341.
  • [5] Site web de Cello
  • [6] Site web du langage Verilog
  • [7] C. Hardt, M.E. Beber, A. Rasche, A. Kamburov, D.G. Hebels, J.C. Kleinjans, and R. Herwig, ToxDB: pathway-level interpretation of drug-treatment data, Database (Oxford), 2016 Apr 13. DOI:10.1093/database/baw052
  • [8] ToxDB

Acronymes et Abréviations

  • HMG: Hypothetical Minimal Genome

Created by Jean-Christophe Taveau — MS in Bioinformatics, Bordeaux, France