2 Introducción a Bioconductor
Bioconductor, the R package repository for the “analysis and comprehension of high-throughput genomic data” http://bioconductor.org/
Blog post que escribí en 2014: Where do I start using Bioconductor? http://lcolladotor.github.io/2014/10/16/startbioc/#.XqxNGRNKiuo
Sobre Bioconductor: http://bioconductor.org/about/
- Fui parte (04/2020- 04/2023) del Community Advisory Board http://bioconductor.org/about/community-advisory-board/ ^^
- Artículos principales
2.1 Encontrando paquetes de Bioconductor
- Tipos de paquetes de Bioconductor:
- Software: tipo de paquete principal; la mayoría los hacen usuarios aunque algunos los hacen gente pagada directamente por Bioconductor
- Annotation: facilitan el interactuar con bases de datos de anotación
- Experiment Data: contienen datos para algún artículo o datos que se usan en ejemplos más exhaustivos
- Workflows: demuestran como puedes usar varios paquetes de Bioconductor para ciertos tipos de análisis
- Para descubrir paquetes:
- Software: http://bioconductor.org/packages/release/bioc/
- Annotation: http://bioconductor.org/packages/release/data/annotation/
- Experiment Data: http://bioconductor.org/packages/release/data/experiment/
- Workflows: http://bioconductor.org/packages/release/workflows/
- Paquetes de R de Leo: https://lcolladotor.github.io/pkgs/
- Encontrando paquetes a través de
biocViews
: http://bioconductor.org/packages/release/BiocViews.html#___Software- Estructura tipo árbol
- Son 4 árboles principales: software, annotation, experiment, workflow
- Dentro de cada árbol, un paquete puede ser parte de varias ramas
- Tiene una búsqueda de texto simple
- Ejemplo: Software → WorkflowStep → Visualization → http://bioconductor.org/packages/release/BiocViews.html#___Visualization (486 paquetes en BioC 3.11 abril-octubre 2020, 506 en BioC 3.12 octubre 2020-abril 2021, 536 en BioC 3.14 octubre 2021-abril 2022, 542 en BioC 3.16 octubre 2022-abril 2023, 558 en BioC 3.18 octubre 2023-abril 2024)
2.2 Estructura de un paquete de BioC
- Usa
https://bioconductor.org/packages/<pkg_name>
- Ejemplo: https://bioconductor.org/packages/recount
- Otro ejemplo: https://bioconductor.org/packages/SummarizedExperiment
- Badges (etiquetas): rápidamente podemos evaluar como está
- Parráfo de descripción del paquete
- Cómo citar al paquete de Bioconductor
- Cómo instalarlo. Más detalles en http://bioconductor.org/install/
- Documentación
- Una líga por cada vignette en formato PDF o HTML. ¡Es la documentación principal!
- Una vignette es donde lxs autores del paquete explican cómo usar las diferentes funciones del paquete y en qué orden
- Detalles
- Términos de
biocViews
- Cómo se relaciona a otros paquetes (depends, imports, linking to, suggests, depends on me, …)
- URL: donde puedes encontrar el código fuente
- BugReports: donde puedes pedir ayuda
- Términos de
- Más detalles sobre el paquete
- Estadísticas de descargas
2.3 Las dos ramas de Bioconductor: release y devel
- Dos ramas
release
, actualmente 3.18devel
, actualmente 3.19- Ejemplo: http://bioconductor.org/packages/devel/bioc/html/recount.html
- Bioconductor es actualizado cada 6 meses (abril y octubre). R lo actualizan 1 vez al año (abril).
- Todo el software lo prueban en macOS, Windows y linux
- Resumen BioC 3.18 http://bioconductor.org/news/bioc_3_18_release/
- Blog post en LIBD rstats club: Quick overview on the new Bioconductor 3.8 release http://research.libd.org/rstatsclub/2018/11/02/quick-overview-on-the-new-bioconductor-3-8-release/
2.4 Cursos y eventos
- http://bioconductor.org/help/events/
- http://bioconductor.org/help/course-materials/
- BioC2023: conferencia principal anual https://bioc2023.bioconductor.org/
- Talleres del BioC2019: https://rebrand.ly/biocworkshops2019
Teach online data science, bioinformatics, or other computational skills interactively using the Orchestra platform:https://t.co/r4aJ2xAZbh
— Sean Davis (@seandavis12) January 10, 2021
Nearly 50 workshop environments preloaded with #jupyter, #rstudio, #shell. #rstats, or #python.@NIHSTRIDES @NIHDataScience @Bioconductor pic.twitter.com/HyWVLBJxGU
- El que ayudo a organizar en México: CDSB Workshop 2021 https://comunidadbioinfo.github.io/post/cdsb-2021-workshops/#.YflG7erMJD8
2.5 Comunidad
- Slack: https://bioc-community.herokuapp.com/
- Sitio web de ayuda: https://support.bioconductor.org/
- Usa la(s) etiqueta(s) adecuada(s) para que lxs autores de los paquetes reciban email de forma automática
- Ejemplo: https://support.bioconductor.org/tag/recount/
- Pueden revisar ese sitio web y usarlo para aprender cómo en https://lcolladotor.github.io/bioc_team_ds/helping-others.html#bioconductor-support-practice-grounds
- Twitter: https://twitter.com/bioconductor. Desde diciembre 2023 ya no lo mantienen como lo explicaron en https://blog.bioconductor.org/posts/2023-11-17-twitter-exit/.
2.6 Ejercicio grupal
- Exploren en http://bioconductor.org/news/bioc_3_18_release/ la lista de nuevos paquetes de Bioconductor (BioC 3.18)
- Cada quien escoja un paquete o dos
- Exploren la documentación del paquete, si es que está pasando las pruebas en los diferentes sistemas operativos, si es que lxs autores han respondido a las preguntas de lxs usuarixs, etc.
- Discutan cuales paquetes les interesaron más como equipo y escriban un resumen de su discusión en sus notas en GitHub.
- Ejemplo de una actividad similar:
Today was different, so no video. We used breakout rooms to work in pairs & highlight new @Bioconductor 3.12 📦s in a spreadsheet, then we chatted about themhttps://t.co/GDVDmGshIr
— LIBD rstats club (@LIBDrstats) November 6, 2020
125 new software 📦s + much more! Lots of new toys to look at!https://t.co/C4qXfrQMm7#rstats pic.twitter.com/niGUP6Tns8
At the end of October we did a "@Bioconductor 3.14 release overview" led by @lcolladotor
— LIBD rstats club (@LIBDrstats) December 1, 2021
There's lots of new interesting packages out there! #rstats
📔 https://t.co/PAfcnAGN9a
📹 https://t.co/w8o8BxoBBo
- (Opcional) Escriban un tweet / en Bluesky / un blog post promocionando el paquete que más les gustó y etiqueten a lxs autores si es que están en Twitter. Está plática de Mara Averick para
rstudio::conf(2018)
explica cómo comunicar información vía tweets https://rstudio.com/resources/rstudioconf-2018/phrasing-communicating-data-science-through-tweets-gifs-and-classic-misdirection/.