Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
fr:impilopedia:genex:rnaseq:airway_project:fetching_raw_data [2026/05/28 12:22] – [Introduction] foisysfr:impilopedia:genex:rnaseq:airway_project:fetching_raw_data [2026/05/28 14:52] (Version actuelle) – [Introduction] foisys
Ligne 6: Ligne 6:
   * Dans un premier temps, il nous faut obtenir les fichiers source FASTQ bruts, qu'ils proviennent d'une plateforme de séquençage ou bien d'une base de données. Comment les organisés de manière optimale? Dans le cas précis de notre projet, on a diverses lignées cellulaires humaines qui nous servent à observer les changements de l'expression génique selon divers traitements. Il est par conséquent logique d'assembler les fichiers par traitement plutôt que par lignée.   * Dans un premier temps, il nous faut obtenir les fichiers source FASTQ bruts, qu'ils proviennent d'une plateforme de séquençage ou bien d'une base de données. Comment les organisés de manière optimale? Dans le cas précis de notre projet, on a diverses lignées cellulaires humaines qui nous servent à observer les changements de l'expression génique selon divers traitements. Il est par conséquent logique d'assembler les fichiers par traitement plutôt que par lignée.
   * De plus, plusieurs personnes dans un projet pourraient avoir un besoin de lire les informations contenues dans ces fichiers. Il est alors nécessaire de les mettre dans un endroit du système de fichiers accessible à tous mais en les protégeant en modifiant les permissions afin qu'ils soient accessibles en lecture mais ne peuvent être éditer. Un autre point: on ne veut pas que personne d'autre vienne y mettre d'autres fichiers par accident ou autre :-)   * De plus, plusieurs personnes dans un projet pourraient avoir un besoin de lire les informations contenues dans ces fichiers. Il est alors nécessaire de les mettre dans un endroit du système de fichiers accessible à tous mais en les protégeant en modifiant les permissions afin qu'ils soient accessibles en lecture mais ne peuvent être éditer. Un autre point: on ne veut pas que personne d'autre vienne y mettre d'autres fichiers par accident ou autre :-)
-  * Une idée sur la marche à suivre: +  * Une idée sur la marche à suivre: nous avons construit les fichiers index sous ''/shares/data'', un répertoire accessible pour tous dans le système de fichiers. alors construisons un nouveau répertoire pour y mettre tous les projets de transcriptomique basés sur le séquençage ài haut débit:
-    * Nous avons construit les fichiers index sous ''/shares/data'', un répertoire accessible pour tous dans le système de fichiers. alors construisons un nouveau répertoire pour y mettre tous les projets de transcriptomique basés sur le séquençage à haut débit:+
 <sxh bash> <sxh bash>
 % mkdir /shares/data/rnaseq % mkdir /shares/data/rnaseq
 +% mkdir /shares/data/rnaseq/airway
 </sxh> </sxh>
 +    * Nous savons (en lisant le papier associé) que les lignées ont subit l'un des traitements suivant: DMSO comme contrôle, albuterol, dexaméthasone ou albuterol+dexaméthasone. On crée alors une hiérarchie avec cette information:
 +<sxh bash>
 +% cd /shares/data/rnaseq/airway
 +% mkdir dmso
 +% mkdir alb
 +% mkdir dexa
 +% mkdir alb_dexa
 +</sxh>
 +
 +  * Permissions: plus à venir...
 +
 +  * Dans le cas de l'analyse, le simple fait que chacun peut la faire selon ses propres hypothèses, on va plutôt mettre le tout dans notre répertoire ''$HOME'':
 +<sxh bash>
 +# On reste générique car le repertoire peut contenir
 +# autre chose que des projets de transcriptomique...
 +% mkdir $HOME/analysis
 +% mkdir $HOME/analysis/rnaseq
 +% cp -r /shares/data/rnaseq/airway $HOME/analysis/rnaseq
 +</sxh>
 + 
 +  * Plus à venir...