Forwarded from letters to robot
Firefox latest drama
В силу последних новостей с Firefox, хочется напомнить об одном замечательном ресурсе:
https://spyware.neocities.org/
spyware watchdog — сайт на платформе neocities посвящённый обзору на различные spyware. То есть программное обеспечения осуществляющего шпионаж за пользователем.
На сайте приведены обзоры на различное ПО и его spyware status, то есть осуществляет ли это ПО слежку за пользователем. Заходите в раздел с браузерами, заходите в обзор firefox — и ВНЕЗАПНО firefox считался spyware ещё задолго до этой новости. В статье приведена инфа про то как именно файрфокс звонит домой в mozilla. Правда там рядом есть ещё mitigation guide — tutorial на тему того как отключить всю слежку.
Я его не читал правда, я сразу использовал arkenfox, сборку user.js для firefox, которую рекомендовала Solene%.
Что же делать пользователям Firefox в такое трудное для приватности время ?
Ну почти ничего: вы можете не дожидаться того как выйдет новый браузер ladybird. Вы можете не переходить на материалистичный Dillo, на хацкерский quterbrowser, на лисповый nyxt.
Вы точно так же можете просто поставить Arkenfox.
Если хотите меньше тратить времени на настройку может поставить ungoogled-chromium, в винде он доступен через пакетник scoop например. Этот браузер собран из свободного chromium, только в нём ещё все домены гугла заменены регулярным выражением на несуществующий домен. Это набор патчей.
Если ещё меньше хочется настраивать, то можно поставить iridium и по гайду с spyware watchdog прожать одну галочку.
Что же буду делать я ?
Я останусь на firefox с arkenfox, потому что я плотно подсел на вкладки контейнеры.
Правда это фича приватности, а не безопасности. Она обеспечивает цифровую компартментализацию (digital compartmentalization): все куки которые получает браузер теперь лежат не в одном профиле браузера, каждый в своём контейнере.
Я так например могу открыть вкладку с AWS в контейнере «работа», cloudflare со своим доменом и github в контейнере «личное», а iis.bsuir.by в контейнере «bsuir». Да, вы можете добавлять контейнеры сами.
Ещё меня держит интеграция с парольным менеджером keepassxc.
Что же делать, если действительно заботиться не только о приватности, но и безопасности, OPSEC, и прочих вечных вопросах существования ?
Ну, по хорошему компьютер без интернета или qubes os, а так можно поставить вместо очередного браузера virtualbox с операционной системой whonix.
В силу последних новостей с Firefox, хочется напомнить об одном замечательном ресурсе:
https://spyware.neocities.org/
spyware watchdog — сайт на платформе neocities посвящённый обзору на различные spyware. То есть программное обеспечения осуществляющего шпионаж за пользователем.
На сайте приведены обзоры на различное ПО и его spyware status, то есть осуществляет ли это ПО слежку за пользователем. Заходите в раздел с браузерами, заходите в обзор firefox — и ВНЕЗАПНО firefox считался spyware ещё задолго до этой новости. В статье приведена инфа про то как именно файрфокс звонит домой в mozilla. Правда там рядом есть ещё mitigation guide — tutorial на тему того как отключить всю слежку.
Я его не читал правда, я сразу использовал arkenfox, сборку user.js для firefox, которую рекомендовала Solene%.
Что же делать пользователям Firefox в такое трудное для приватности время ?
Ну почти ничего: вы можете не дожидаться того как выйдет новый браузер ladybird. Вы можете не переходить на материалистичный Dillo, на хацкерский quterbrowser, на лисповый nyxt.
Вы точно так же можете просто поставить Arkenfox.
Если хотите меньше тратить времени на настройку может поставить ungoogled-chromium, в винде он доступен через пакетник scoop например. Этот браузер собран из свободного chromium, только в нём ещё все домены гугла заменены регулярным выражением на несуществующий домен. Это набор патчей.
Если ещё меньше хочется настраивать, то можно поставить iridium и по гайду с spyware watchdog прожать одну галочку.
Что же буду делать я ?
Я останусь на firefox с arkenfox, потому что я плотно подсел на вкладки контейнеры.
Правда это фича приватности, а не безопасности. Она обеспечивает цифровую компартментализацию (digital compartmentalization): все куки которые получает браузер теперь лежат не в одном профиле браузера, каждый в своём контейнере.
Я так например могу открыть вкладку с AWS в контейнере «работа», cloudflare со своим доменом и github в контейнере «личное», а iis.bsuir.by в контейнере «bsuir». Да, вы можете добавлять контейнеры сами.
Ещё меня держит интеграция с парольным менеджером keepassxc.
Что же делать, если действительно заботиться не только о приватности, но и безопасности, OPSEC, и прочих вечных вопросах существования ?
Ну, по хорошему компьютер без интернета или qubes os, а так можно поставить вместо очередного браузера virtualbox с операционной системой whonix.
Telegram
Okhsunrog's Logs
У Firefox совсем дела стали плохи?
Forwarded from Николай
Please open Telegram to view this post
VIEW IN TELEGRAM
Для предзаказа стала доступна новая книга профессора Харриса: RISC-V System-On-Chip Design.
По ссылке в начале поста можно ознакомиться с содержанием книги. В основе материала лежит open-source Linux-сapable процессор Wally, о котором вы можете узнать больше на Github-странице проекта.
По этой ссылке можно ознакомиться с обзором ядра Wally от авторов книги.
O процессоре Wally и о том, как вы можете поучаствовать в его разработке я уже писал в предыдущем посте.
Приобрести издание можно на сайте издательства Elsevier.
Сейчас на изучение нового материала нет времени, поэтому отложу в корзину до лучших времен и скидок☺️
По ссылке в начале поста можно ознакомиться с содержанием книги. В основе материала лежит open-source Linux-сapable процессор Wally, о котором вы можете узнать больше на Github-странице проекта.
По этой ссылке можно ознакомиться с обзором ядра Wally от авторов книги.
O процессоре Wally и о том, как вы можете поучаствовать в его разработке я уже писал в предыдущем посте.
Приобрести издание можно на сайте издательства Elsevier.
Сейчас на изучение нового материала нет времени, поэтому отложу в корзину до лучших времен и скидок
Please open Telegram to view this post
VIEW IN TELEGRAM
Elsevier Shop
RISC-V System-On-Chip Design
RISC-V Microprocessor System-On-Chip Design is written to be accessible to an advanced undergraduate audience with limited background. It ex
Intel® Advanced Vector Extensions 10.2
В июле 2024 года Intel представила новую версию AVX10, в которой добавлены новые инструкции и поддержка FP8. Одним из интересных нововведений стала поддержка операций нахождения максимума и минимума среди операндов с плавающей запятой в векторном расширении, реализованная с учетом логики NaN propagation согласно спецификации IEEE-754 2019 года. В соответствии с этой логикой NaN возвращается только в случае, если оба операнда являются NaN. Теперь инструкции нахождения максимума и минимума поддерживают оба режима NaN propagation — в соответствии с IEEE-754 2019 и IEEE-754 2008, что позволяет разработчикам явно задавать логику NaN propagation.
Подобная реализация дает возможность программному обеспечения, ориентированному на работу с IEEE-754 2008, сохранить прежнюю логику обработки NaN, а для новых алгоритмов использовать более строгую семантику IEEE-754 2019.
Занимательно, что в сентябре 2023 года аналогичные инструкции были добавлены в архитектуру RISC-V в рамках расширения "Zfa" (Standard Extension for Additional Floating-Point Instructions).
Основное отличие заключается в том, что в RISC-V управление NaN propagation для инструкций поиска максимума и минимума реализовано только для скалярных инструкций, тогда как в Intel AVX10 это реализовано для векторных операций.
Кроме того, в последней версии спецификации RISC-V указано, что в экосистеме RISC-V для операций поиска максимума и минимума по умолчанию используется последняя версия стандарта IEEE-754 — на данный момент это версия 2019 года. В то же время в расширении Zfa были добавлены отдельные инструкции, специально реализующие поведение NaN propagation в соответствии со стандартом IEEE-754 2008 года.
Несмотря на то, что Intel и RISC-V представляют собой принципиально разные подходы как с точки зрения компьютерной архитектуры, так и с точки зрения уровня проприетарности (открытая архитектура RISC-V против закрытой Intel), обе экосистемы демонстрируют стремление к сохранению совместимости с существующим программным обеспечением. Это подчёркивает важность обратной совместимости и гибкости в выборе логики обработки NaN для поддержки старых алгоритмов и упрощения перехода на новые стандарты.
В июле 2024 года Intel представила новую версию AVX10, в которой добавлены новые инструкции и поддержка FP8. Одним из интересных нововведений стала поддержка операций нахождения максимума и минимума среди операндов с плавающей запятой в векторном расширении, реализованная с учетом логики NaN propagation согласно спецификации IEEE-754 2019 года. В соответствии с этой логикой NaN возвращается только в случае, если оба операнда являются NaN. Теперь инструкции нахождения максимума и минимума поддерживают оба режима NaN propagation — в соответствии с IEEE-754 2019 и IEEE-754 2008, что позволяет разработчикам явно задавать логику NaN propagation.
Подобная реализация дает возможность программному обеспечения, ориентированному на работу с IEEE-754 2008, сохранить прежнюю логику обработки NaN, а для новых алгоритмов использовать более строгую семантику IEEE-754 2019.
Занимательно, что в сентябре 2023 года аналогичные инструкции были добавлены в архитектуру RISC-V в рамках расширения "Zfa" (Standard Extension for Additional Floating-Point Instructions).
Основное отличие заключается в том, что в RISC-V управление NaN propagation для инструкций поиска максимума и минимума реализовано только для скалярных инструкций, тогда как в Intel AVX10 это реализовано для векторных операций.
Кроме того, в последней версии спецификации RISC-V указано, что в экосистеме RISC-V для операций поиска максимума и минимума по умолчанию используется последняя версия стандарта IEEE-754 — на данный момент это версия 2019 года. В то же время в расширении Zfa были добавлены отдельные инструкции, специально реализующие поведение NaN propagation в соответствии со стандартом IEEE-754 2008 года.
Несмотря на то, что Intel и RISC-V представляют собой принципиально разные подходы как с точки зрения компьютерной архитектуры, так и с точки зрения уровня проприетарности (открытая архитектура RISC-V против закрытой Intel), обе экосистемы демонстрируют стремление к сохранению совместимости с существующим программным обеспечением. Это подчёркивает важность обратной совместимости и гибкости в выборе логики обработки NaN для поддержки старых алгоритмов и упрощения перехода на новые стандарты.
A64 SIMD Instruction List: SVE Instructions
Нашел интересный ресурс. На сайте представлены инструкции из SVE расширения для ARM.
Удобно, что есть поддержка пресетов, чтобы посмотреть наборы инструкций для популярных чипов, например такие как A64FX и М4. Для каждой инструкции также представлена наглядная диаграмма, которая помогает лучше понять, как работает векторная операция в SVE сабсете.
Данный ресурс не является официальным справочным материалом и может содержать ошибки.
Аналогичный ресурс для x86/x64 SIMD Instruction List (SSE to AVX512) : https://www.officedaytime.com/simd512e/
Нашел интересный ресурс. На сайте представлены инструкции из SVE расширения для ARM.
Удобно, что есть поддержка пресетов, чтобы посмотреть наборы инструкций для популярных чипов, например такие как A64FX и М4. Для каждой инструкции также представлена наглядная диаграмма, которая помогает лучше понять, как работает векторная операция в SVE сабсете.
Данный ресурс не является официальным справочным материалом и может содержать ошибки.
Аналогичный ресурс для x86/x64 SIMD Instruction List (SSE to AVX512) : https://www.officedaytime.com/simd512e/
AraXL: A Physically Scalable, Ultra-Wide RISC-V Vector Processor Design for Fast and Efficient Computation on Long Vectors
Замечательная статья от исследователей из ETH Zurich посвящена проектированию векторных сопроцессоров с широкими векторами.
Особый интерес вызывает предложенный метод разбиения большого числа векторных линий на кластеры по 4 линии в каждом, что эффективно снижает нагрузку на межсоединения, необходимые для реализации cross-lane операций и маскирования. Авторы отдельно подчёркивают сложности масштабирования, возникающие при использовании традиционных «all-to-all» соединений между линиями, и предлагают решение этой проблемы через иерархическую структуру межсоединений. В частности, значительная часть cross-lane взаимодействий локализуется внутри кластеров, что уменьшает плотность и сложность межкластерных соединений. Дополнительно авторы вводят кольцевой интерфейс (RING Interconnect, RINGI), который упрощает передачу данных между кластерами и снижает аппаратную сложность при реализации широких векторных операций.
Также следует отметить представленный авторами floorplan, в котором между кластерами намеренно оставлены промежутки как по вертикали, так и по горизонтали. Это позволяет эффективно распределить межкластерные соединения, значительно снизить плотность межсоединений (congestion) и облегчить физическую реализацию, что особенно критично при разработке широких VPU с большим количеством векторных линий.
Замечательная статья от исследователей из ETH Zurich посвящена проектированию векторных сопроцессоров с широкими векторами.
Особый интерес вызывает предложенный метод разбиения большого числа векторных линий на кластеры по 4 линии в каждом, что эффективно снижает нагрузку на межсоединения, необходимые для реализации cross-lane операций и маскирования. Авторы отдельно подчёркивают сложности масштабирования, возникающие при использовании традиционных «all-to-all» соединений между линиями, и предлагают решение этой проблемы через иерархическую структуру межсоединений. В частности, значительная часть cross-lane взаимодействий локализуется внутри кластеров, что уменьшает плотность и сложность межкластерных соединений. Дополнительно авторы вводят кольцевой интерфейс (RING Interconnect, RINGI), который упрощает передачу данных между кластерами и снижает аппаратную сложность при реализации широких векторных операций.
Также следует отметить представленный авторами floorplan, в котором между кластерами намеренно оставлены промежутки как по вертикали, так и по горизонтали. Это позволяет эффективно распределить межкластерные соединения, значительно снизить плотность межсоединений (congestion) и облегчить физическую реализацию, что особенно критично при разработке широких VPU с большим количеством векторных линий.
Please open Telegram to view this post
VIEW IN TELEGRAM
А чтобы разбавить духоту выше, принёс вам мемес. В четверг или в пятницу принесу классное чтиво на выходные по векторным процессорам.
Кстати, поделитесь в комментариях, на какие интересные новости, пейперы или посты натыкались в последнее время по тематике цифрового дизайна и компьютерных архитектур.
В последнее время глаз сильно замылился на матрично-векторных задачках — наверняка много интересного упустил👀
Кстати, поделитесь в комментариях, на какие интересные новости, пейперы или посты натыкались в последнее время по тематике цифрового дизайна и компьютерных архитектур.
В последнее время глаз сильно замылился на матрично-векторных задачках — наверняка много интересного упустил
Please open Telegram to view this post
VIEW IN TELEGRAM
Как и обещал, принес вам классное чтиво — Ph.D. диссертацию Krste Asanović по теме векторных процессоров.
Несмотря на то, что работа была написана в далёком 1987 году, считаю важным с ней ознакомиться.
Автор — один из основателей SiFive, соавтор векторной спецификации RISC-V и участник команды, внесшей вклад в культовую книгу Computer Architecture: A Quantitative Approach.
Отличная возможность увидеть, с чего начинался путь Krste в цифровом дизайне и архитектуре компьютеров.
Vector Microprocessors by Krste Asanović
Несмотря на то, что работа была написана в далёком 1987 году, считаю важным с ней ознакомиться.
Автор — один из основателей SiFive, соавтор векторной спецификации RISC-V и участник команды, внесшей вклад в культовую книгу Computer Architecture: A Quantitative Approach.
Отличная возможность увидеть, с чего начинался путь Krste в цифровом дизайне и архитектуре компьютеров.
Vector Microprocessors by Krste Asanović
Please open Telegram to view this post
VIEW IN TELEGRAM
Студенты и энтузиасты, а помните, как я давным-давно обещал вам разбор задачек с QuickSilicon?
Так вот, я подумал — зачем разбирать уже готовые, если можно придумать свои 🙂
Хочу поделиться опытом взаимодействия с организатором площадки для тренинга QuickSilicon. Эта платформа в первую очередь ориентирована на монетизацию — продажу курсов с задачами разной сложности и разборами в стиле LeetCode. Однако есть и бесплатный раздел — с простыми задачами, доступный каждому зарегистрированному пользователю.
Я связался с автором платформы — Rahul Behl, бывшим инженером Arm, а теперь сотрудником Tenstorrent. Предложил ему создать раздел с открытыми и бесплатными задачами от сообщества — чтобы у энтузиастов и профессионалов появилась возможность делиться своими задачами, используя уже существующую платформу.
Задачка, которую я подготовил, довольно простая, на реализацию логики rotation двумя способами.
Ознакомиться с задачкой можно по ссылке:
https://quicksilicon.in/course/21daysofrtl/module/bonus1
Изначально я предложил оставить тестбенч для автопроверки, но Rahul объяснил, что идея раздела 21 Days of RTL — в том, чтобы участник писал не только дизайн, но и верификацию самостоятельно.
Почему я об этом рассказываю?
Потому что считаю это отличным инструментом для студентов и энтузиастов, которые хотят изучать цифровой дизайн и компьютерную архитектуру.
Ничего не нужно устанавливать — ни симуляторов, ни Quartus, ни Yosys, - всё работает прямо в браузере.
А если вы — опытный разработчик и хотите предложить свою задачку, теперь такой функционал поддерживается владельцами платформы. Они открыты к совместной работе и готовы публиковать задачи от сообщества.
Конечно, QuickSilicon не заменит полноценное обучение, но может стать отличным дополнением и точкой входа для начинающих.
Stay tuned!😎
Так вот, я подумал — зачем разбирать уже готовые, если можно придумать свои 🙂
Хочу поделиться опытом взаимодействия с организатором площадки для тренинга QuickSilicon. Эта платформа в первую очередь ориентирована на монетизацию — продажу курсов с задачами разной сложности и разборами в стиле LeetCode. Однако есть и бесплатный раздел — с простыми задачами, доступный каждому зарегистрированному пользователю.
Я связался с автором платформы — Rahul Behl, бывшим инженером Arm, а теперь сотрудником Tenstorrent. Предложил ему создать раздел с открытыми и бесплатными задачами от сообщества — чтобы у энтузиастов и профессионалов появилась возможность делиться своими задачами, используя уже существующую платформу.
Задачка, которую я подготовил, довольно простая, на реализацию логики rotation двумя способами.
Ознакомиться с задачкой можно по ссылке:
https://quicksilicon.in/course/21daysofrtl/module/bonus1
Изначально я предложил оставить тестбенч для автопроверки, но Rahul объяснил, что идея раздела 21 Days of RTL — в том, чтобы участник писал не только дизайн, но и верификацию самостоятельно.
Почему я об этом рассказываю?
Потому что считаю это отличным инструментом для студентов и энтузиастов, которые хотят изучать цифровой дизайн и компьютерную архитектуру.
Ничего не нужно устанавливать — ни симуляторов, ни Quartus, ни Yosys, - всё работает прямо в браузере.
А если вы — опытный разработчик и хотите предложить свою задачку, теперь такой функционал поддерживается владельцами платформы. Они открыты к совместной работе и готовы публиковать задачи от сообщества.
Конечно, QuickSilicon не заменит полноценное обучение, но может стать отличным дополнением и точкой входа для начинающих.
Stay tuned!
Please open Telegram to view this post
VIEW IN TELEGRAM
Forwarded from Паразитное сопротивление
Вышли из тени еще одни желающие сделать чип-дизайн открытым.
Калифорнийский стартап ZeroASIC представил открытую архитектуру FPGA, которую они хотят сделать плисовым аналогом RISC-V. Дизайн самого чипа проприетарный (GF 12 нм), но архитектура описана, а весь маршрут синтеза RTL, генерации и записи битстрима опенсорсный. На гитхабе много интересного.
Предполагается, что найдутся желающие поддержать начинание и организовать концорциум по образцу RISC-V Foundation. Звучит чрезмерно амбициозно, но саму идею демократизации чип-дизайна я могу только поддержать.
Калифорнийский стартап ZeroASIC представил открытую архитектуру FPGA, которую они хотят сделать плисовым аналогом RISC-V. Дизайн самого чипа проприетарный (GF 12 нм), но архитектура описана, а весь маршрут синтеза RTL, генерации и записи битстрима опенсорсный. На гитхабе много интересного.
Предполагается, что найдутся желающие поддержать начинание и организовать концорциум по образцу RISC-V Foundation. Звучит чрезмерно амбициозно, но саму идею демократизации чип-дизайна я могу только поддержать.
Те, кто давно читает канал или знаком со мной лично, наверняка знают, что когда речь заходит об учебных программах и курсах по компьютерной архитектуре и цифровому дизайну, я всегда ставлю в пример ETH Zurich.
Недавно наткнулся на интересный вопрос из экзамена курса ETH Zurich.
Думаю, ни для кого не секрет, что ChatGPT и другие модели активно применяются при разработке софта и аппаратурыпривет vibe-кодерам! Но не менее важно, что студенты всё чаще используют их для выполнения домашних заданий и курсовых проектов.
Так вот, в экзамене ETH Zurich в разделе вопросов по Verilog появилась задача с говорящим названием: «Is ChatGPT not Right?»🧐
Суть задачи:
Вы попросили ChatGPT написать за вас простую логику управления движением персонажа в 2D-пространстве на Verilog. Ваша задача:
а) Заменить числовые заглушки на корректные варианты в Verilog коде.
б) (Самое главное!) Определить место в Verilog коде, где ChatGPT допустил ошибку, объяснить её причину и предложить исправление.
На мой взгляд, такой подход невероятно актуален сегодня, когда многие начинающие инженеры излишне доверяют инструментам кодогенерации. При генерации кода на языках описания аппаратуры ошибки и галлюцинации нейросетей встречаются на порядок чаще, чем в задач и примерах для софта.
Предлагаю вам поучаствовать в небольшом интерактиве: найдите место, где ChatGPT сгаллюцинировал, и предложите ваш вариант ответа в комментариях. Вечером я опубликую правильный ответ.
Если вы не хотите сбивать других участников с толку, не стесняйтесь прятать свой ответ под спойлер.
Код и описание задачки смотри в следующем посте😑
Недавно наткнулся на интересный вопрос из экзамена курса ETH Zurich.
Думаю, ни для кого не секрет, что ChatGPT и другие модели активно применяются при разработке софта и аппаратуры
Так вот, в экзамене ETH Zurich в разделе вопросов по Verilog появилась задача с говорящим названием: «Is ChatGPT not Right?»
Суть задачи:
Вы попросили ChatGPT написать за вас простую логику управления движением персонажа в 2D-пространстве на Verilog. Ваша задача:
а) Заменить числовые заглушки на корректные варианты в Verilog коде.
б) (Самое главное!) Определить место в Verilog коде, где ChatGPT допустил ошибку, объяснить её причину и предложить исправление.
На мой взгляд, такой подход невероятно актуален сегодня, когда многие начинающие инженеры излишне доверяют инструментам кодогенерации. При генерации кода на языках описания аппаратуры ошибки и галлюцинации нейросетей встречаются на порядок чаще, чем в задач и примерах для софта.
Предлагаю вам поучаствовать в небольшом интерактиве: найдите место, где ChatGPT сгаллюцинировал, и предложите ваш вариант ответа в комментариях. Вечером я опубликую правильный ответ.
Если вы не хотите сбивать других участников с толку, не стесняйтесь прятать свой ответ под спойлер.
Код и описание задачки смотри в следующем посте
Please open Telegram to view this post
VIEW IN TELEGRAM
You gave ChatGPT the following prompt to help with your lab report: A Verilog module that simulates
a character's movement on a 2D-plane. The module takes four inputs for four directions (direction inputs) the character can move to. The module outputs x and y coordinates. The character stays in the same coordinate if none of the direction inputs are set. Initial coordinates (set on reset) are 0, 0. Stride determines how many units the character moves in one step.
a character's movement on a 2D-plane. The module takes four inputs for four directions (direction inputs) the character can move to. The module outputs x and y coordinates. The character stays in the same coordinate if none of the direction inputs are set. Initial coordinates (set on reset) are 0, 0. Stride determines how many units the character moves in one step.
SIMD Instructions Considered Harmful
Пост Дэвида Паттерсона и Эндрю Уотермана, 2017
Классная статья о развитии векторных архитектур и проблемах, с которыми столкнулись SIMD-расширения от Intel и MIPS, а также о концепции Scalable Vector, лёгшей в основу ARM SVE и RISC-V Vector.
Пост Дэвида Паттерсона и Эндрю Уотермана, 2017
Классная статья о развитии векторных архитектур и проблемах, с которыми столкнулись SIMD-расширения от Intel и MIPS, а также о концепции Scalable Vector, лёгшей в основу ARM SVE и RISC-V Vector.
How Google Lies About the Power of Its Latest Chips, Compared to El Capitan
А что тут у нас? Опять манипуляции с термином FLOPS?🐱
В статье подробно разбирается, как Google в своём пресс-релизе утверждает, что их кластер Ironwood мощностью 42,5 Exaflops (в FP8) в 24 раза превосходит суперкомпьютер El Capitan, производительность которого составляет 1,7 Exaflops (в FP64, по LINPACK). На деле это сравнение некорректно, поскольку Google использует пиковое значение в формате FP8, применимое для AI-задач, тогда как для El Capitan приводится стандартизированная производительность в формате FP64, применимая к научным вычислениям.
Картинка к посту прекрасно описывает мое отношение к маркетингу вокруг термина FLOPS😈
Перес-релиз от Google - Ironwood: The first Google TPU for the age of inference
p.s. и другой "прекрасный" термин от Nvidia - AI TOPS
А что тут у нас? Опять манипуляции с термином FLOPS?
В статье подробно разбирается, как Google в своём пресс-релизе утверждает, что их кластер Ironwood мощностью 42,5 Exaflops (в FP8) в 24 раза превосходит суперкомпьютер El Capitan, производительность которого составляет 1,7 Exaflops (в FP64, по LINPACK). На деле это сравнение некорректно, поскольку Google использует пиковое значение в формате FP8, применимое для AI-задач, тогда как для El Capitan приводится стандартизированная производительность в формате FP64, применимая к научным вычислениям.
Картинка к посту прекрасно описывает мое отношение к маркетингу вокруг термина FLOPS
Перес-релиз от Google - Ironwood: The first Google TPU for the age of inference
p.s. и другой "прекрасный" термин от Nvidia - AI TOPS
Please open Telegram to view this post
VIEW IN TELEGRAM
В продолжении темы Vector Length Agnostic хочу поделиться интересными видеолекциями из серии Arm software developers
Эти видеолекции посвящены особенностям и возможностям нового векторного расширения Arm Scalable Vector Extension (SVE).
Рассматриваются ключевые преимущества SVE, включая аппаратно-независимую длину векторов, расширенные инструкции управления памятью и векторами (gather/scatter), механизмы предикации и спекулятивного исполнения, а также особенности программирования векторного сопроцессора.
1) Leveraging SVE Vectorization for HPC Workloads
2) Introduction to Arm SVE
Эти видеолекции посвящены особенностям и возможностям нового векторного расширения Arm Scalable Vector Extension (SVE).
Рассматриваются ключевые преимущества SVE, включая аппаратно-независимую длину векторов, расширенные инструкции управления памятью и векторами (gather/scatter), механизмы предикации и спекулятивного исполнения, а также особенности программирования векторного сопроцессора.
1) Leveraging SVE Vectorization for HPC Workloads
2) Introduction to Arm SVE
YouTube
[Arm DevSummit - Session] Leveraging SVE Vectorization for HPC Workloads
Abstract: Arm’s SVE units are designed to enable the next generation of high-performance Arm-based processors. They are used in the Fujitsu A64FX which powers the Fugaku supercomputer, one of the fastest in the world. The SVE represents a paradigm shift for…