Вспоминаем важное: как выбрать из толпы публикаций, что же все-таки почитать?
поддержать канал
поддержать канал
какая-то библиотека
#анонс семинара: продолжаем изучать информационно\библиографический поиск ✨ Семинар проведет Иван Евгеньевич Прозоров, канд.пед.наук О чем будет занятие? 🖇 Целеполагание поиска: что и зачем мы ищем? 🖇 С помощью чего мы ищем и в чем заключается ловушка "простого…
через 5 минут начинаем семинар! продолжим говорить про поиск вместе с Иваном Евгеньевичем Прозоровым!
Присоединяйтесь! https://meet.google.com/fut-sgss-fxy
Присоединяйтесь! https://meet.google.com/fut-sgss-fxy
Google
Real-time meetings by Google. Using your browser, share your video, desktop, and presentations with teammates and customers.
Соседи по Телеграму — канал "Бластим: работа и курсы в биотехе" ответили на мои вопросы об информационных ресурсах для биотеха. Очень много полезного. Делюсь без цензуры и правок — сохраняйте и используйте.
Telegram
Бластим: курсы и работа в биотехе
❤️ Наши курсы: agency.blastim.ru
🥨 Свежие вакансии в биотехе: blastim.ru
🤖 Курс «ML на Python для решения биоинформатических задач» с 8 июля: clck.ru/3MfnJc
🤝 По сотрудничеству и рекламе: @edu_blastim
📚 По вопросам о курсах: @varvara_blastim
🥨 Свежие вакансии в биотехе: blastim.ru
🤖 Курс «ML на Python для решения биоинформатических задач» с 8 июля: clck.ru/3MfnJc
🤝 По сотрудничеству и рекламе: @edu_blastim
📚 По вопросам о курсах: @varvara_blastim
❓Какие научные источники используют ученые в биотехе?
Как и везде, ученые в биотехе ищут публикации. Первое, куда можно отправиться, чтобы собрать библиотеку статей по интересующей теме — это портал NCBI, на котором великое множество полезных БД для биоинформатиков и биологов. Например, литературная БД по биомедицине PubMed, где есть абстракты статей. Еще статьи можно искать в ScienceDirect, Google Scholar, ResearchGate (это вообще целая соцсеть для ученых). А препринты публикаций лежат здесь: bioRxiv, chemRxiv
Чтобы проверить цитирования и библиометрию стоит воспользоваться Web of Science, Scopus, elibrary.ru, ORCID или istina.msu.ru.
❓Что, кроме статей и монографий, нужно исследователям в биотехе? Дата-сеты, базы с химическими формулами?
В своей работе ученые из биотеха используют не только публикации, но еще и многочисленные базы данных и различные программы. К счастью, очень много информации доступно в открытом доступе и ее может изучать любой желающий. Такая традиция началась еще c The Human Genome Project, когда было решено выложить прочитанный геном человека в общий доступ, а не патентовать.
Например, сегодня востребованы БД: нуклеотидные последовательности хранятся в GenBank (архив, куда ученые загружают данные секвенирования перед публикациями статей), а также в курируемой БД Refseq, аннотации геномов лежат в Ensembl, белковые последовательности — UniProt, 3D структуры белков — PDB, мутации — dbSNP, эпигенетика — ENCODE, онкология — TCGA, химические соединения — PubChem, метаболические пути — KEGG, клинические исследования — clinical.trials.gov. Мы привели лишь малую толику самых известных баз данных, еще больше можно найти тут.
Помимо информации из баз данных нужны различные инструменты для их обработки. Это могут быть веб-приложения (например, биоинформатический калькулятор protpi.ch), десктопные программы (Jmol, VMD, Origin, clustal, gnuplot). Или пакеты на R (например, pagoda, deseq2, больше тут) или библиотеки Python (matplotlib, seaborn и еще примеры) и других языках, которые биоинформатики запускают из командной строки. Есть крутые вещи на основе ИИ — к примеру, автоматический анализатор изображений CellProfiler.
❓С какими сложностями при поиске научных публикаций и данных сталкиваются исследователи в биотехе?
Многие базы данных, например, генов или геномов, никак не курируются экспертами и туда попадает непроверенная информация. Другая проблема — нехватка данных: пропущенные значения в датасетах, наличие информации только для модельных организмов (допустим, есть FlyBase для дрозофилы, но она не годится для других насекомых), данные разношерстные — их трудно интегрировать. Кроме того, многие геномы до сих пор не полностью собраны и хранятся в виде контиг, что затрудняет их активное использование.
К тому же, в статьях часто плохо описаны и поэтому невоспроизводимы протоколы экспериментальных методов.
Еще проблема — отсутствие публикаций в свободном доступе, тогда их нужно искать. Для этого можно использовать Sci-hub (статьи до 2021 года), Nexus Search bot. Отдельный челлендж — систематизировать литературу у себя на компьютере, тут поможет Mendeley.
❓Если ли интересные интернет-сервисы для исследователей в биотехе, которые мы можете посоветовать студентам?
Многие простые тулы доступны в браузере и не требуют навыков программирования. Скажем, легендарный онлайн-инструмент в биоинформатике, тоже поддерживаемый NCBI, — выравниватель BLAST, или геномные браузеры для удобной визуализации и сравнения геномов — UCSC Genome Browser, IGV.
Для упрощения работы и автоматизации можно также применять чат боты, к примеру, Phind для отладки кода, нашумевшие ChatGPT, Bard для автоматизации повседневных задач, или superbio.ai — мощный инструмент для биологов, через который, положим, можно запустить AlphaFold2 и посмотреть на предсказанные компьютером пространственные структуры протеинов!
Еще классная вещь Biorender — для рисования биологической инфографики.
💜 Ответила на вопросы команда канала "Бластим: работа и курсы в биотехе".
Как и везде, ученые в биотехе ищут публикации. Первое, куда можно отправиться, чтобы собрать библиотеку статей по интересующей теме — это портал NCBI, на котором великое множество полезных БД для биоинформатиков и биологов. Например, литературная БД по биомедицине PubMed, где есть абстракты статей. Еще статьи можно искать в ScienceDirect, Google Scholar, ResearchGate (это вообще целая соцсеть для ученых). А препринты публикаций лежат здесь: bioRxiv, chemRxiv
Чтобы проверить цитирования и библиометрию стоит воспользоваться Web of Science, Scopus, elibrary.ru, ORCID или istina.msu.ru.
❓Что, кроме статей и монографий, нужно исследователям в биотехе? Дата-сеты, базы с химическими формулами?
В своей работе ученые из биотеха используют не только публикации, но еще и многочисленные базы данных и различные программы. К счастью, очень много информации доступно в открытом доступе и ее может изучать любой желающий. Такая традиция началась еще c The Human Genome Project, когда было решено выложить прочитанный геном человека в общий доступ, а не патентовать.
Например, сегодня востребованы БД: нуклеотидные последовательности хранятся в GenBank (архив, куда ученые загружают данные секвенирования перед публикациями статей), а также в курируемой БД Refseq, аннотации геномов лежат в Ensembl, белковые последовательности — UniProt, 3D структуры белков — PDB, мутации — dbSNP, эпигенетика — ENCODE, онкология — TCGA, химические соединения — PubChem, метаболические пути — KEGG, клинические исследования — clinical.trials.gov. Мы привели лишь малую толику самых известных баз данных, еще больше можно найти тут.
Помимо информации из баз данных нужны различные инструменты для их обработки. Это могут быть веб-приложения (например, биоинформатический калькулятор protpi.ch), десктопные программы (Jmol, VMD, Origin, clustal, gnuplot). Или пакеты на R (например, pagoda, deseq2, больше тут) или библиотеки Python (matplotlib, seaborn и еще примеры) и других языках, которые биоинформатики запускают из командной строки. Есть крутые вещи на основе ИИ — к примеру, автоматический анализатор изображений CellProfiler.
❓С какими сложностями при поиске научных публикаций и данных сталкиваются исследователи в биотехе?
Многие базы данных, например, генов или геномов, никак не курируются экспертами и туда попадает непроверенная информация. Другая проблема — нехватка данных: пропущенные значения в датасетах, наличие информации только для модельных организмов (допустим, есть FlyBase для дрозофилы, но она не годится для других насекомых), данные разношерстные — их трудно интегрировать. Кроме того, многие геномы до сих пор не полностью собраны и хранятся в виде контиг, что затрудняет их активное использование.
К тому же, в статьях часто плохо описаны и поэтому невоспроизводимы протоколы экспериментальных методов.
Еще проблема — отсутствие публикаций в свободном доступе, тогда их нужно искать. Для этого можно использовать Sci-hub (статьи до 2021 года), Nexus Search bot. Отдельный челлендж — систематизировать литературу у себя на компьютере, тут поможет Mendeley.
❓Если ли интересные интернет-сервисы для исследователей в биотехе, которые мы можете посоветовать студентам?
Многие простые тулы доступны в браузере и не требуют навыков программирования. Скажем, легендарный онлайн-инструмент в биоинформатике, тоже поддерживаемый NCBI, — выравниватель BLAST, или геномные браузеры для удобной визуализации и сравнения геномов — UCSC Genome Browser, IGV.
Для упрощения работы и автоматизации можно также применять чат боты, к примеру, Phind для отладки кода, нашумевшие ChatGPT, Bard для автоматизации повседневных задач, или superbio.ai — мощный инструмент для биологов, через который, положим, можно запустить AlphaFold2 и посмотреть на предсказанные компьютером пространственные структуры протеинов!
Еще классная вещь Biorender — для рисования биологической инфографики.
Please open Telegram to view this post
VIEW IN TELEGRAM
Друзья и подруги, привет!
Осенний семестр для меня выдался очень насыщенным и потому изматывающим. У меня много идей, но пока нет сил и времени, чтобы их реализовать. Поэтому какая-то библиотека уходит на каникулы, чтобы набраться сил для вас и контента.
Увидимся в январе!💜
Осенний семестр для меня выдался очень насыщенным и потому изматывающим. У меня много идей, но пока нет сил и времени, чтобы их реализовать. Поэтому какая-то библиотека уходит на каникулы, чтобы набраться сил для вас и контента.
Увидимся в январе!
Please open Telegram to view this post
VIEW IN TELEGRAM