2 Introducción a Bioconductor
Bioconductor, the R package repository for the “analysis and comprehension of high-throughput genomic data” http://bioconductor.org/
Blog post que escribí en 2014: Where do I start using Bioconductor? http://lcolladotor.github.io/2014/10/16/startbioc/#.XqxNGRNKiuo
Sobre Bioconductor: http://bioconductor.org/about/
- Soy parte del Community Advisory Board http://bioconductor.org/about/community-advisory-board/ ^^
- Artículos principales
2.1 Encontrando paquetes de Bioconductor
- Tipos de paquetes de Bioconductor:
- Software: tipo de paquete principal; la mayoría los hacen usuarios aunque algunos los hacen gente pagada directamente por Bioconductor
- Annotation: facilitan el interactuar con bases de datos de anotación
- Experiment Data: contienen datos para algún artículo o datos que se usan en ejemplos más exhaustivos
- Workflows: demuestran como puedes usar varios paquetes de Bioconductor para ciertos tipos de análisis
- Para descubrir paquetes:
- Software: http://bioconductor.org/packages/release/bioc/
- Annotation: http://bioconductor.org/packages/release/data/annotation/
- Experiment Data: http://bioconductor.org/packages/release/data/experiment/
- Workflows: http://bioconductor.org/packages/release/workflows/
- Paquetes de R de Leo: https://lcolladotor.github.io/pkgs/
- Encontrando paquetes a través de
biocViews
: http://bioconductor.org/packages/release/BiocViews.html#___Software- Estructura tipo árbol
- Son 4 árboles principales: software, annotation, experiment, workflow
- Dentro de cada árbol, un paquete puede ser parte de varias ramas
- Tiene una búsqueda de texto simple
- Ejemplo: Software → WorkflowStep → Visualization → http://bioconductor.org/packages/release/BiocViews.html#___Visualization (486 paquetes en BioC 3.11 abril-octubre 2020, 506 en BioC 3.12 octubre 2020-abril 2021)
2.2 Estructura de un paquete de BioC
- Usa
https://bioconductor.org/packages/<pkg_name>
- Ejemplo: https://bioconductor.org/packages/recount
- Otro ejemplo: https://bioconductor.org/packages/SummarizedExperiment
- Badges (etiquetas): rápidamente podemos evaluar como está
- Parráfo de descripción del paquete
- Cómo citar al paquete de Bioconductor
- Cómo instalarlo. Más detalles en http://bioconductor.org/install/
- Documentación
- Una líga por cada vignette en formato PDF o HTML. Es la documentación principal!
- Una vignette es donde lxs autores del paquete explican cómo usar las diferentes funciones del paquete y en qué orden
- Detalles
- Términos de
biocViews
- Cómo se relaciona a otros paquetes (depends, imports, linking to, suggests, depends on me, …)
- URL: donde puedes encontrar el código fuente
- BugReports: donde puedes pedir ayuda
- Términos de
- Más detalles sobre el paquete
- Estadísticas de descargas
2.3 Las dos ramas de Bioconductor: release y devel
- Dos ramas
release
, actualmente 3.12devel
, actualmente 3.13- Ejemplo: http://bioconductor.org/packages/devel/bioc/html/recount.html
- Bioconductor tiene es actualizado cada 6 meses (abril y octubre). R lo actualizan 1 vez al año (abril).
- Todo el software lo prueban en macOS, Windows y linux
- Resumen BioC 3.12 http://bioconductor.org/news/bioc_3_12_release/
- Blog post en LIBD rstats club: Quick overview on the new Bioconductor 3.8 release http://research.libd.org/rstatsclub/2018/11/02/quick-overview-on-the-new-bioconductor-3-8-release/
2.4 Cursos y eventos
- http://bioconductor.org/help/events/
- http://bioconductor.org/help/course-materials/
- BioC2021: conferencia principal anual https://bioc2021.bioconductor.org/
- Talleres del BioC2019: https://rebrand.ly/biocworkshops2019
Teach online data science, bioinformatics, or other computational skills interactively using the Orchestra platform:https://t.co/r4aJ2xAZbh
— Sean Davis (@seandavis12) January 10, 2021
Nearly 50 workshop environments preloaded with #jupyter, #rstudio, #shell. #rstats, or #python.@NIHSTRIDES @NIHDataScience @Bioconductor pic.twitter.com/HyWVLBJxGU
- El que ayudo a organizar en México: CDSB Workshop 2020 https://comunidadbioinfo.github.io/post/cdsb2020-building-workflows-with-rstudio-and-scrnaseq-with-bioconductor/#.XmJT-Z-YU1I
2.5 Comunidad
- Slack: https://bioc-community.herokuapp.com/
- Sitio web de ayuda: https://support.bioconductor.org/
- Usa la(s) etiqueta(s) adecuada(s) para que lxs autores de los paquetes reciban email de forma automática
- Ejemplo: https://support.bioconductor.org/t/recount/
- Pueden revisar ese sitio web y usarlo para aprender cómo en https://lcolladotor.github.io/bioc_team_ds/helping-others.html#bioconductor-support-practice-grounds
- Twitter: https://twitter.com/bioconductor
2.6 Ejercicio grupal
- Exploren en http://bioconductor.org/news/bioc_3_12_release/ la lista de nuevos paquetes de Bioconductor (BioC 3.12)
- Cada quien escoja un paquete o dos
- Exploren la documentación del paquete, si es que está pasando las pruebas en los diferentes sistemas operativos, si es que lxs autores han respondido a las preguntas de lxs usuarixs, etc.
- Discutan cuales paquetes les interesaron más como equipo y escriban un resumen de su discusión en sus notas en GitHub.
- Ejemplo de una actividad similar:
Today was different, so no video. We used breakout rooms to work in pairs & highlight new @Bioconductor 3.12 📦s in a spreadsheet, then we chatted about themhttps://t.co/GDVDmGshIr
— LIBD rstats club (@LIBDrstats) November 6, 2020
125 new software 📦s + much more! Lots of new toys to look at!https://t.co/C4qXfrQMm7#rstats pic.twitter.com/niGUP6Tns8
- (Opcional) Escriban un tweet promocionando el paquete que más les gustó y etiqueten a lxs autores si es que están en Twitter. Está plática de Mara Averick para
rstudio::conf(2018)
explica cómo comunicar información vía tweets https://rstudio.com/resources/rstudioconf-2018/phrasing-communicating-data-science-through-tweets-gifs-and-classic-misdirection/.