Каждая база данных станет векторной базой данных рано или поздно.
https://nextword.substack.com/p/vector-database-is-not-a-separate
https://nextword.substack.com/p/vector-database-is-not-a-separate
Enterprise AI Trends
Vector database is not a separate database category
Why every database will become a vector database, sooner or later
Выбор векторной базы данных: сравнение и ориентир на 2023 год
https://benchmark.vectorview.ai/vectordbs.html
https://benchmark.vectorview.ai/vectordbs.html
SQL в Pandas с Pandasql
Хотите запросить ваши фреймы данных pandas с помощью SQL? Узнайте, как это сделать, используя библиотеку Python Pandasql. https://www.kdnuggets.com/sql-in-pandas-with-pandasql
Хотите запросить ваши фреймы данных pandas с помощью SQL? Узнайте, как это сделать, используя библиотеку Python Pandasql. https://www.kdnuggets.com/sql-in-pandas-with-pandasql
KDnuggets
SQL in Pandas with Pandasql
Want to query your pandas dataframes using SQL? Learn how to do so using the Python library Pandasql.
Мы представляем pg_bm25: расширение Postgres на основе Rust, которое значительно улучшает возможности полнотекстового поиска Postgres.
pg_bm25назван в честь BM25 — алгоритма, используемого современными поисковыми системами для расчета показателей релевантности результатов поиска. https://docs.paradedb.com/blog/introducing_bm25
Как уменьшить размер базы данных PostgreSQL
В этой статье рассматривается несколько стратегий, которые помогут вам значительно и устойчиво уменьшить размер базы данных PostgreSQL. https://www.timescale.com/blog/how-to-reduce-your-postgresql-database-size
pg_bm25назван в честь BM25 — алгоритма, используемого современными поисковыми системами для расчета показателей релевантности результатов поиска. https://docs.paradedb.com/blog/introducing_bm25
Как уменьшить размер базы данных PostgreSQL
В этой статье рассматривается несколько стратегий, которые помогут вам значительно и устойчиво уменьшить размер базы данных PostgreSQL. https://www.timescale.com/blog/how-to-reduce-your-postgresql-database-size
ParadeDB
ParadeDB: Zero ETL search and analytics for Postgres
У нас для тебя есть дебетовая карта с кэшбэком и ежемесячным доходом на остаток — Tinkoff Black в космическом дизайне 🚀🌌, которая позволяет зарабатывать реальные рубли с каждой покупки.
Оставь заявку на оформление карты потратить от 3000 рублей в течение месяца после активации карты и получи 1000 рублей кэшбэка.
Переходи по ссылке и оформляй себе карту:
https://l.tinkoff.ru/pesero
Please open Telegram to view this post
VIEW IN TELEGRAM
Очистка данных. Часть 1. Освоение стандартизации данных с помощью SQL
https://medium.com/@sheelapadhy1996/data-cleaning-part-1-mastering-data-standardization-with-sql-f1229fa6bd78
https://medium.com/@sheelapadhy1996/data-cleaning-part-1-mastering-data-standardization-with-sql-f1229fa6bd78
Medium
Data Cleaning Part 1: Mastering Data Standardization with SQL
Data standardization is a fundamental step in data management to ensure data quality and consistency making it suitable for analysis…
Темпоральные типы в PostgreSQL и их использование.
Меня зовут Фролков Иван, я работаю программистом с 1993 года, и уже восемь лет — в Postgres Professional. Периодически выступаю на конференциях. В этой статье я расскажу вам про темпоральные типы данных в PostgreSQL — доклад о них я читал на PGConf.Russia 2022. Почему меня это заинтересовало? Мне много раз приходилось сталкиваться с тем, что из-за разницы часовых поясов не сходились отчёты за месяц или даже за сутки. Подобные проблемы возникают из-за неаккуратной обработки даты и времени, которой можно избежать.
В чём проблема?
Часто мы начинаем сверять данные из разных мест, и они почему-то оказываются разными. Мало кто явно указывает часовой пояс при указании времени, что впоследствии приводит к ошибкам. Например, если в общий лог пишут и из Москвы, и из Новосибирска, а часовой пояс не указан, трудно понять, какое событие когда произошло.
У меня была ситуация, когда я работал в международной компании с серверами по всему миру. Паника из-за неверного построения отчётов там возникала дважды в сутки. Сначала поднимались московские менеджеры и ругались, что цифры получаются не те. Мы поправляли часовые пояса, и всё было хорошо до тех пор, пока не просыпались менеджеры в Сан-Франциско. Они тоже выдвигали претензии по цифрам, мы снова исправляли время, но после этого опять «уезжала» Москва.
Заря приходит с востока
С чем же связаны такие проблемы? С тем, что Земля круглая, и время наступает везде по-разному. Казалось бы, это тривиальное знание, но в реальности его мало кто учитывает. На востоке часовые пояса с плюсом, а на западе — с минусом. Где-то посередине располагается Гринвич, нулевой меридиан (кстати, в Лондоне есть летнее время, и оно не совпадает с гринвичским!). Есть ещё места вроде Непала и Бутана, где время сдвигается не на полные часы, а на 45 или 15 минут, и это может создать вам проблемы.
Читать далее https://habr.com/ru/companies/postgrespro/articles/766998
Меня зовут Фролков Иван, я работаю программистом с 1993 года, и уже восемь лет — в Postgres Professional. Периодически выступаю на конференциях. В этой статье я расскажу вам про темпоральные типы данных в PostgreSQL — доклад о них я читал на PGConf.Russia 2022. Почему меня это заинтересовало? Мне много раз приходилось сталкиваться с тем, что из-за разницы часовых поясов не сходились отчёты за месяц или даже за сутки. Подобные проблемы возникают из-за неаккуратной обработки даты и времени, которой можно избежать.
В чём проблема?
Часто мы начинаем сверять данные из разных мест, и они почему-то оказываются разными. Мало кто явно указывает часовой пояс при указании времени, что впоследствии приводит к ошибкам. Например, если в общий лог пишут и из Москвы, и из Новосибирска, а часовой пояс не указан, трудно понять, какое событие когда произошло.
У меня была ситуация, когда я работал в международной компании с серверами по всему миру. Паника из-за неверного построения отчётов там возникала дважды в сутки. Сначала поднимались московские менеджеры и ругались, что цифры получаются не те. Мы поправляли часовые пояса, и всё было хорошо до тех пор, пока не просыпались менеджеры в Сан-Франциско. Они тоже выдвигали претензии по цифрам, мы снова исправляли время, но после этого опять «уезжала» Москва.
Заря приходит с востока
С чем же связаны такие проблемы? С тем, что Земля круглая, и время наступает везде по-разному. Казалось бы, это тривиальное знание, но в реальности его мало кто учитывает. На востоке часовые пояса с плюсом, а на западе — с минусом. Где-то посередине располагается Гринвич, нулевой меридиан (кстати, в Лондоне есть летнее время, и оно не совпадает с гринвичским!). Есть ещё места вроде Непала и Бутана, где время сдвигается не на полные часы, а на 45 или 15 минут, и это может создать вам проблемы.
Читать далее https://habr.com/ru/companies/postgrespro/articles/766998
Хабр
Темпоральные типы в PostgreSQL и их использование
Меня зовут Фролков Иван, я работаю программистом с 1993 года, и уже восемь лет — в Postgres Professional. Периодически выступаю на конференциях. В этой статье я расскажу вам про темпоральные типы...
Postgres.js — самый быстрый полнофункциональный клиент PostgreSQL для Node.js, Deno, Bun и CloudFlare.
https://github.com/porsager/postgres
https://github.com/porsager/postgres
GitHub
GitHub - porsager/postgres: Postgres.js - The Fastest full featured PostgreSQL client for Node.js, Deno, Bun and CloudFlare
Postgres.js - The Fastest full featured PostgreSQL client for Node.js, Deno, Bun and CloudFlare - porsager/postgres
Простой ORM для sqlite3.
ORM, или объектно-реляционное отображение — это программная технология, которая позволяет взаимодействовать с базами данных с использованием объектно-ориентированной парадигмы. Вместо того чтобы писать SQL-запросы напрямую для работы с данными в базе данных, можно использовать ORM, чтобы взаимодействовать с данными, как если бы они были объектами в вашем коде.
Не бывало ли вам интересно, как работает изнутри такая идейно простая концепция? Благодаря чему достигается удобство работы? Сегодня мы напишем ORM самостоятельно и узнаем, какие инструменты python нам для этого понадобятся. Читать дальше →https://habr.com/ru/companies/ruvds/articles/766552
ORM, или объектно-реляционное отображение — это программная технология, которая позволяет взаимодействовать с базами данных с использованием объектно-ориентированной парадигмы. Вместо того чтобы писать SQL-запросы напрямую для работы с данными в базе данных, можно использовать ORM, чтобы взаимодействовать с данными, как если бы они были объектами в вашем коде.
Не бывало ли вам интересно, как работает изнутри такая идейно простая концепция? Благодаря чему достигается удобство работы? Сегодня мы напишем ORM самостоятельно и узнаем, какие инструменты python нам для этого понадобятся. Читать дальше →https://habr.com/ru/companies/ruvds/articles/766552
Хабр
Простой ORM для sqlite3
ORM, или объектно-реляционное отображение — это программная технология, которая позволяет взаимодействовать с базами данных с использованием объектно-ориентированной парадигмы. Вместо того чтобы...
Как мы создали механизм потокового SQL
https://www.epsio.io/blog/how-to-create-a-streaming-sql-engine
https://www.epsio.io/blog/how-to-create-a-streaming-sql-engine
www.epsio.io
How we built a Streaming SQL Engine
Oct 01, 2024
Как подключить проект Node.js к MongoDB: подробное руководство
MongoDB — популярная база данных NoSQL, которая позволяет разработчикам гибко и масштабируемо хранить данные и управлять ими. https://hojaleaks.com/how-to-connect-a-nodejs-project-with-mongodb-a-comprehensive-guide
Оптимизация SQL-запросов с помощью примеров кода на Go
https://earthly.dev/blog/optimize-sql-queries-golang
MongoDB — популярная база данных NoSQL, которая позволяет разработчикам гибко и масштабируемо хранить данные и управлять ими. https://hojaleaks.com/how-to-connect-a-nodejs-project-with-mongodb-a-comprehensive-guide
Оптимизация SQL-запросов с помощью примеров кода на Go
https://earthly.dev/blog/optimize-sql-queries-golang
HojaLeaks Coding Tutorials
How to Connect a Node.js Project with MongoDB: A Comprehensive Guide
MongoDB is a popular NoSQL database that allows developers to store and manage data in a flexible and scalable manner.
Omnigres делает Postgres платформой приложений, ориентированной на разработчиков. Вы можете развернуть один экземпляр базы данных, и на нем будет размещаться все ваше приложение, масштабируемое по мере необходимости. https://github.com/omnigres/omnigres
GitHub
GitHub - omnigres/omnigres: Postgres as a Business Operating System
Postgres as a Business Operating System. Contribute to omnigres/omnigres development by creating an account on GitHub.
Рекомендации по повышению производительности SQL: настройка производительности для ускорения вашей базы данных
Хотя существует множество факторов, которые могут повлиять на производительность базы данных SQL, и мы не можем охватить их все , в этой статье мы рассмотрим некоторые из наиболее распространенных и наиболее эффективных способов оптимизации производительности вашей реляционной базы данных. https://www.cockroachlabs.com/blog/sql-performance-database-best-practices
Хотя существует множество факторов, которые могут повлиять на производительность базы данных SQL, и мы не можем охватить их все , в этой статье мы рассмотрим некоторые из наиболее распространенных и наиболее эффективных способов оптимизации производительности вашей реляционной базы данных. https://www.cockroachlabs.com/blog/sql-performance-database-best-practices
Cockroachlabs
SQL performance best practices: performance tuning to speed up your database
Learn how to optimize your relational database for better performance, including tuning queries, adding indexes, adjusting your schema, and more!
Как заставить PostgreSQL работать: новые возможности pg_cron
pg_cron — это расширение PostgreSQL с открытым исходным кодом, которое предоставляет планировщик на основе cron для периодического запуска команд SQL. Почти каждый управляемый сервис PostgreSQL поддерживает pg_cron, и он стал стандартным инструментом для многих пользователей PostgreSQL. https://www.citusdata.com/blog/2023/10/26/making-postgres-tick-new-features-in-pg-cron/
pg_cron — это расширение PostgreSQL с открытым исходным кодом, которое предоставляет планировщик на основе cron для периодического запуска команд SQL. Почти каждый управляемый сервис PostgreSQL поддерживает pg_cron, и он стал стандартным инструментом для многих пользователей PostgreSQL. https://www.citusdata.com/blog/2023/10/26/making-postgres-tick-new-features-in-pg-cron/
Citus Data
Making PostgreSQL tick: New features in pg_cron
Since pg_cron 1.5, you can easily schedule jobs that run every 1-59 seconds. And pg_cron 1.6 added support for Postgres 16. This blog post walks you through the benefits of second granularity jobs with the pg_cron open source extension to Postgres.
Индексирование полнотекстовых данных в PostgreSQL с использованием модуля pg_trgm.
PostgreSQL, одна из самых мощных и гибких реляционных СУБД, предлагает нам свой модуль pg_trgm, чтобы решить сложную задачу полнотекстового поиска.
Когда речь идет о поиске, просто LIKE запросы больше не всегда могут удовлетворить технические требования. Полнотекстовый поиск подразумевает не только поиск точных соответствий, но и учет схожести слов, учет морфологии, а также поддержку более сложных запросов. PostgreSQL, конечно, предоставляет средства для выполнения таких задач, и модуль pg_trgm - один из инструментов, с помощью которого это можно сделать.
Итак, что такое pg_trgm? Этот модуль PostgreSQL предоставляет набор функций и операторов, которые позволяют работать с трехграммами (триграммами) - это последовательности из трех символов. Для понимания, давайте взглянем на пример...
Читать далее https://habr.com/ru/companies/otus/articles/770674
PostgreSQL, одна из самых мощных и гибких реляционных СУБД, предлагает нам свой модуль pg_trgm, чтобы решить сложную задачу полнотекстового поиска.
Когда речь идет о поиске, просто LIKE запросы больше не всегда могут удовлетворить технические требования. Полнотекстовый поиск подразумевает не только поиск точных соответствий, но и учет схожести слов, учет морфологии, а также поддержку более сложных запросов. PostgreSQL, конечно, предоставляет средства для выполнения таких задач, и модуль pg_trgm - один из инструментов, с помощью которого это можно сделать.
Итак, что такое pg_trgm? Этот модуль PostgreSQL предоставляет набор функций и операторов, которые позволяют работать с трехграммами (триграммами) - это последовательности из трех символов. Для понимания, давайте взглянем на пример...
Читать далее https://habr.com/ru/companies/otus/articles/770674
Хабр
Индексирование полнотекстовых данных в PostgreSQL с использованием модуля pg_trgm
Привет, Хабр! PostgreSQL, одна из самых мощных и гибких реляционных СУБД, предлагает нам свой модуль pg_trgm, чтобы решить сложную задачу полнотекстового поиска. Когда речь идет о поиске, просто LIKE...
This media is not supported in your browser
VIEW IN TELEGRAM
31 интерактивный урок по SQL БЕСПЛАТНО. Более 20 практических упражнений, которые вы решаете прямо в браузере — установка не требуется.
https://datalemur.com/sql-tutorial
https://datalemur.com/sql-tutorial
Иногда вам нужно получить, например, три последних заказа для *каждого* клиента. Обычные соединения не могут этого сделать. Вам нужно выполнить n+1 запросов в коде, а это медленно! Но с помощью латеральных соединений вы можете выполнить соединение цикла for-each в SQL https://sqlfordevs.com/for-each-loop-lateral-join
Forwarded from Шпаргалки для айтишников
This media is not supported in your browser
VIEW IN TELEGRAM
Порядок выполнения SQL