The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Google предложил Device Memory TCP для сетевой передачи данных между устройствами

13.07.2023 11:56

Компания Google представила в списке рассылки разработчиков ядра Linux реализацию механизма Device memory TCP (devmem TCP), позволяющего напрямую по сети передавать данные из памяти одних устройств в память других устройств, без промежуточного копирования этих данных в буферы, размещённые в системной памяти хоста. Реализация пока находится на стадии RFC, т.е. выставлена для обсуждения и рецензирования сообществом, но не оформлена для передачи в основной состав ядра Linux.

Ожидается, что Device memory TCP позволит существенно поднять эффективность взаимодействия в кластерах и распределённых системах машинного обучения, использующих дополнительные платы-ускорители. Применение ускорителей машинного обучения приводит к существенному увеличению объёма информации, передаваемой в процессе обучения моделей из хранилища в память GPU/TPU. В некоторых случаях тренировка моделей машинного обучения может расходовать лишь 50% доступных вычислительных ресурсов TPU, и одним из способов исключения простоев и более полного использования ресурсов GPU/TPU является повышение пропускной способности и эффективности передачи данных.

В настоящее время передача данных между устройствами на разных хостах сводится к копированию данных из памяти устройства в память хоста, передаче информации на другой хост по сети и копированию из памяти целевого хоста в память другого устройства. Подобная схема не является оптимальной и при передаче больших объёмов информации создаёт дополнительную нагрузку на пропускную способность памяти и шины PCIe.

Механизм Device memory TCP позволяет исключить память хостов из этой цепочки и сразу передавать данные по сети из памяти устройств и помещать данные, поступившие в сетевых пакетах, в память устройств. Для работы Device Memory TCP требуется сетевая карта, способная раздельно обрабатывать в разных буферах заголовки пакетов и инкапсулированные в пакеты данные (payload). Данные загружаются из памяти устройства в payload-буфер сетевой карты при помощи механизма dmabuf, а заголовки переносятся из основной памяти и заполняются системным TCP/IP-стеком. Для повышения эффективности дополнительно могут использоваться возможности сетевых карт по отдельной обработке потоков в разных rx-очередях.

Потребность в высокопроизводительном механизме обмена данными между устройствами возрастает с учётом применения для машинного обучения распределённых систем, на которых ускорители находятся на разных хостах, а также когда данные для обучения моделей передаются с внешних SSD-накопителей. Тестирование производительности, проведённое в конфигурации с 4 GPU и 4 сетевыми картами, показало, что применение Device Memory TCP позволяет достигнуть уровня 96.6% от доступной линейной скорости при передаче данных напрямую между памятью устройств.

  1. Главная ссылка к новости (https://lore.kernel.org/lkml/2...)
  2. OpenNews: Проект LibOS развивает вариант ядра Linux с сетевым стеком в форме библиотеки
  3. OpenNews: Fastsocket - новая высокомасштабируемая реализация сетевой подсистемы ядра Linux
  4. OpenNews: Intel представил сокращённый вариант сетевого стека для Linux
  5. OpenNews: Оценка способности сетевого стека Linux обрабатывать миллион пакетов в секунду
  6. OpenNews: Эксперимент по настройке Linux для блокирования 10 млн пакетов в секунду
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/59434-devmem
Ключевые слова: devmem, tcp, google, ai, optimization, linux, kernel
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (113) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (1), 12:11, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Разве rdma не этим занимается?
     
     
  • 2.3, Аноним (3), 12:15, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    А разве RDMA  уже научили из видеопамяти GPU данные передавать? Для RDMA нужно вначале скопировать данные из памяти акселератора в общую память, а именно этого и пытается избежать Google.
     
     
  • 3.5, Страдивариус (?), 12:38, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Эти две памяти в одном адресном пространстве. Какая RDMA разница?
     
     
  • 4.8, Аноним (8), 13:00, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    А нынче память PCI устройств мапится прямиком в линейное адресное пространство? Там же вроде не всё так просто было вроде.
     
     
  • 5.14, Unnamed Player (?), 13:11, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    DMA этим и занимается.
     
     
  • 6.22, Аноним (22), 13:25, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    для PCI нету DMA, зато есть bus mastering.
     
     
  • 7.51, Аноним (51), 15:48, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Щито? У PCI DMA есть и прекрасно работает (как бы иначе им, например, сетевыми пользовались, или они в твоём мире на на PCI шине висят?). Более того, на базе p2p dma работает майковский direct storage для игруль (там, правда, dma между nvme и gpu).
     
  • 7.84, Аноним (84), 01:35, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > для PCI нету DMA, зато есть bus mastering.

    Вот те раз - кто это DMA у него с314дил? А bus mastering это возможность со стороны девайса транзакции инициировать - передавая данные например в другой девайс без участия системного проца в этом. При такой инверсии ролей вопрос DMA оказывается на другой стороне... и у GPU например есть свои нехилые DMA-движки на его стороне, на такие случаи и много что еще, оффлоадящие основной массив от уделения внимания шине.

     
     
  • 8.90, Анонним (?), 10:34, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    напомню - что DMA controller - это был контроллер на материке подключенный к ISA... текст свёрнут, показать
     
     
  • 9.99, Аноним (-), 15:12, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Напомню что многие PCI железки сейчас являют собой нефиговый программно аппаратн... большой текст свёрнут, показать
     
     
  • 10.103, Аноним (22), 18:57, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    В спецификациях - данных режим называется bus mastering Ибо доступом к памяти о... большой текст свёрнут, показать
     
     
  • 11.113, Аноним (-), 01:31, 16/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не отменяет возможность устройств лезть в память Поэтому Согласно википедии,... большой текст свёрнут, показать
     
  • 5.21, Аноним (22), 13:24, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    если устройство экспортит память в BAR - то да, в линейное адресное пространство.
     
  • 5.95, Страдивариус (?), 13:21, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > А нынче память PCI устройств мапится прямиком в линейное адресное пространство? Там
    > же вроде не всё так просто было вроде.

    Нынче? Ну же лет как двадцать. Бывали времена, когда на некоторых железках в адресное пространство CPU торчало только окно из всей памяти устройства и надо было выбирать в какой регион памяти на железке это окно отображается. Я могу ошибаться, но сейчас этим уже никто не занимается, по крайней мере на мощных железках, у которых дохрена памяти на борту.

     
  • 2.91, ebanyrust (?), 11:32, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Разве rdma не этим занимается?

    разница в деталях - для RDMA используются специальные сетевые протоколы и работают они минуя сетевой стек ядра, гугловский подход намного универсальней - работает с ядрёным TCP/IP

    > Данные загружаются из памяти устройства в payload-буфер сетевой карты при помощи механизма dmabuf, а заголовки переносятся из основной памяти и заполняются системным TCP/IP-стеком.

     
     
  • 3.94, An2 (?), 12:58, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > для RDMA используются специальные сетевые протоколы ... гугловский подход намного универсальней ...
    > Ожидается, что Device memory TCP позволит существенно поднять эффективность взаимодействия ...

    Обычно "специальные" означает сложнее/неудобнее, но эффективнее чем "универсальные". Как же гуглу удалось обойти этот принцип?

     
     
  • 4.96, ebanyrust (?), 13:28, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Как же гуглу удалось обойти этот принцип?

    payload загружается через DMA, заголовок обрабатывается центральным процессором - что непонятно в этом принципе ? полезных данных на порядки больше чем служебных данных из заголовка. На таком же принципе весь dmabuf - буфер с данными для аппаратного DMA + служебная информация для CPU.

     
     
  • 5.98, Аноним (22), 14:52, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    не понятно все. Никто кроме Mellanox такой финт ушами сделать не даст.
    Для передачи можно делать, для приема - нет.
     
     
  • 6.102, ebanyrust (?), 15:40, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Никто кроме Mellanox такой финт ушами сделать не даст.

    гугли NIC with Header Data Split, подозреваю что с 10Gb все поддерживают

     
     
  • 7.104, Аноним (22), 19:07, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Нужен не просто Header Data Split, в том то и дело Split означает что ты ложишь... большой текст свёрнут, показать
     
     
  • 8.106, ebanyrust (?), 19:53, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    не надо усложнять https lore kernel org lkml 20230710223304 1174642-1-almasrym... большой текст свёрнут, показать
     
     
  • 9.107, Аноним (22), 23:11, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    да я и неусложняю Просто так получилось что в этой теме пришлось покопаться дос... большой текст свёрнут, показать
     
     
  • 10.115, Аноним (115), 12:08, 16/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    то что гугловский патч использует стандартные ядерные интерфейсы вместо вендор-к... текст свёрнут, показать
     
     
  • 11.116, Аноним (116), 12:29, 16/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Nvidia дает нормальный POSIX API для работы с файлами из GPU программ что позво... текст свёрнут, показать
     
     
  • 12.117, Аноним (115), 12:38, 16/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    они так же дают eglstream, только он никому не нужен обычный вендорлок, не удиви... текст свёрнут, показать
     
  • 9.109, Аноним (22), 23:22, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    pps я ниже кидал ссылки на работы Facebook по той же теме Там тоже завязка на ... текст свёрнут, показать
     
  • 7.105, Аноним (22), 19:09, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    если глянуть в более ранную публикацию
    https://netdevconf.info/0x14/pub/slides/62/Implementing%20TCP%20RX&#
    Ability for a NIC to dissect packets and place header and
    data into separate places.
    Not all NIC implement header-data split, unfortunately.
    Google has for instance a fair amount of servers using Mellanox CX-3 (mlx4)

    Опять Mellanox.

     

  • 1.2, Аноним (2), 12:14, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +13 +/
    > позволяющего напрямую по сети передавать данные из памяти одних устройств в память других устройств

    Через центральные гугловские сервера?

     
     
  • 2.6, Аноним (6), 12:39, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +4 +/
    Through uranus, pal
     
  • 2.88, Аноним (88), 07:22, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Через хост device-memory-tcp.googleapis.com все будет передаваться
     

  • 1.4, Аноним (4), 12:37, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    очень круто. например можно сделать сетевую карту GPU. Если у вас два компа и ноутбук, можно "запускать" видюшку компа на ноутбуке.
     
     
  • 2.18, Аноним (18), 13:21, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Очень круто, можно напрямую брать поток из памяти твоей видеокарты, больще не надо троянов, обходов натов и т.д. т.майор сразу получает медаль за организацию схемы :)
     
     
  • 3.20, Аноним (22), 13:24, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    давай я тебя удивлю - для этого не нужно ничего кроме мелкого модуля подгрузить.
    man gdrcopy. И да, для допиливания под AMD практически ничего не надо, для Intel чуть больше всего надо.


     
  • 3.48, Аноним (48), 15:34, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Господа и товарищи майоры всего мира аплодируют стоя.
     
  • 3.61, Аноним (61), 18:42, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > поднять эффективность взаимодействия в кластерах и распределённых системах машинного обучения

    Зачем ты смотришь цэпэ на кластере и распределённой системе машинного обучения?

     
     
  • 4.83, Аноним (83), 22:57, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Это не для смотришь, это набор данных для машинного обучения.
     
  • 2.26, Аноним (-), 13:52, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    > очень круто. например можно сделать сетевую карту GPU. Если у вас два компа и ноутбук,
    > можно "запускать" видюшку компа на ноутбуке.

    Еще круче трахнуть тебя по сети через DMA, запатчив сетевым пакетом сразу кернел или гипервизор. Чтобы бац - и в дамки.

     
  • 2.46, Kuromi (ok), 15:28, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Только не говорите мне что это Штадия 2.0
    Хотя идея интересна, позволит окончательно поработить всех по модели Hardware-as-service
     
     
  • 3.81, Аноним (81), 22:10, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    И Android будет из себя представлять лишь frontend к железу в ангаре гугла через связь 6G.
     
  • 2.89, boo (??), 10:33, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Полоса пропускания памяти Radeon RX 7900 XTX - 960 Гигабайт в секунду. Желаю удачи в постройке сети. С другой стороны, если надо просто изображение и звук перебросить, то для этого уже давным давно есть решения.
     

  • 1.7, Аноним (7), 12:48, 13/07/2023 Скрыто ботом-модератором [﹢﹢﹢] [ · · · ]     [к модератору]
  • +6 +/
     

     ....ответы скрыты (5)

  • 1.9, Аноним (9), 13:04, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +7 +/
    Ну т.е. обычных дыр недостаточно. Проще уж напрямую.
    Понимаемо, чо.
     
     
  • 2.59, Аноним (58), 18:04, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    а с учетем нейроинтерфейса, будет коллективная память, под кураторством корпораций добра
     

  • 1.11, Аноним (11), 13:06, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Правильно, сначала передать бинарник извне, а потом за счёт уязвимостей добиться его выполнения под рутом.
     
  • 1.13, ZVVZ (?), 13:10, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • –2 +/
    протобаф на максималках, хорошо
     
     
  • 2.39, Аноним (39), 15:00, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    по сути да: там пакеты и тут пакеты. там по сети и тут тоже
     

  • 1.16, Unnamed Player (?), 13:13, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Гугл очередной раз изобретает свой велосипед. RDMA от Гугл
     
     
  • 2.23, Аноним (22), 13:27, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +2 +/
    пытается спереть код/идеи FB.
    https://lore.kernel.org/netdev/6376CA34-BC6F-45DE-9FFD-7E32664C7569@fb.co
    https://www.phoronix.com/news/Facebook-NetGPU-LPC2020
     

  • 1.17, Аноним (-), 13:15, 13/07/2023 Скрыто ботом-модератором [﹢﹢﹢] [ · · · ]     [к модератору]
  • +2 +/
     
  • 1.19, Аноним (22), 13:22, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +2 +/
    Решили спереть идеи Facebook? не взлетит. Будет работать только на железе от NVidia/Mellanox.
     
     
  • 2.25, Аноним (25), 13:49, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –10 +/
    > Будет работать только на железе от NVidia

    Напоминаю, что AMD - это видюха исключительно для игр. Погамать крузис после уроков. Так что NVIDIA достаточно, стандарт индустрии.

     
     
  • 3.29, Аноним (29), 13:58, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +9 +/
    nvidia — не стандарт, а vendor lockin.
     
     
  • 4.32, Аноним (7), 14:27, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –6 +/
    Про вендорлок будешь рассказывать, когда у нвидии появится хоть какой-нибудь конкурент. AMD конкурирует с ним максимум за вантузогеймеров.
     
     
  • 5.85, Аноним (85), 01:38, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Про вендорлок будешь рассказывать, когда у нвидии появится хоть какой-нибудь конкурент.
    > AMD конкурирует с ним максимум за вантузогеймеров.

    Верхушка TOP500 суперкомпьютеров готова с этим нехило поспорить. Кто там, грите, стандарт? :)


     
     
  • 6.93, Аноним (22), 11:50, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    пока в top500 царствует NVidia. Благодаря тому что пропихнула gdrcopy в MPICH-AV.
    Но AMD начала наступать на пятки и то последние года 2.
     
     
  • 7.101, Аноним (101), 15:18, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > пока в top500 царствует NVidia.

    Царствовала. Когда-то. Понятно что легаси с этого царствия еще осталось.

    > Но AMD начала наступать на пятки и то последние года 2.

    Ну да, "начала" - новые модели в верхушке TOP500 набиты амд до отказа все как один. И чего это они вдруг?...

     
     
  • 8.108, Аноним (22), 23:19, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    И сейчас царствует 2 из 10 - против 6 из 10 у Nvidia - это царствует При том ... текст свёрнут, показать
     
     
  • 9.114, Аноним (-), 01:43, 16/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Новые дизайны чего-то идут на AMD Она уже достаточно поотвечала Очень интересн... большой текст свёрнут, показать
     
  • 4.41, Аноним (41), 15:08, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Не-вендорлок AMD сделали ROCm для RDNA3 только спустя почти год после выхода.

    Хуже вендор-лока когда вообще не работает ни хрена.

     
  • 3.30, keydon (ok), 14:17, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    "Стандарты индустрии" это видимо cuda и nvenc. И то и другое отстой и стало стандартом потому что ничего другого тогда не было, а нвидия заносила чемоданы куда нужно. При этом нвидия всегда была дорогой, нестабильной, с отстойными дровами и отстойной поддержкой. К черту такие "стандарты".
     
     
  • 4.42, Аноним (41), 15:09, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Покажи мне инструментарий на базе Vulkan Compute, да такой же богатый как на CUDA.
     
     
  • 5.49, Аноним2 (?), 15:36, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Как только покажешь мне инструментарий на базе CUDA без вендорлока и с нормальными опенсурсными дровами.
     
  • 4.53, Аноним (53), 16:21, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • –1 +/
    А чо это отстой, если качество и того и другого на порядки превосходит конкурентов? При чём тут чемоданы? Просто кто-то работает, а кто-то на рекламу собственной опенсорсности всё впускает.
     
  • 4.56, Аноним (56), 17:41, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > ничего другого тогда не было, а нвидия заносила чемоданы куда нужно

    Я извиняюсь, а зачем нужно было заносить чемоданы, если всё равно ничего другого не было?

     
     
  • 5.86, Аноним (86), 03:23, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Тут просто надо во времени рассматривать. Когда cuda появилась она во-первых работала так себе, во-вторых тогда было другое отношение к вычислениям, никто не хотел ввязываться в непонятную вендор-лочную технологию, многим вообще было странно считать что-то на видеокартах, "в конце концов если сильно надо, можно было и через opengl (не opencl, его тогда не было) считать матрицы как для игр". Собственно для этого и нужна была реклама, промоутинг, продвижение в основные продукты, вот это вот все. Потом появились более открытые продукты, тогда еще openCL, тут еще cuda не была таким вот прям стандартом, а была одним из конкурентов. Тоже нужны были деньги чтобы продвигать технологию в нужные продукты и задвигать конкурентов.
     
  • 3.38, Аноним (39), 14:59, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    для индустрии натуралов. разве что. у нормальных людей задачи не ограничиваются тренеровкой модельки в один клик или игрулями
     
     
  • 4.50, Аноним2 (?), 15:39, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Всю жизнь слышу про нормальных людей. То им настройки в файрфокс не нужны, то наоборот им обязательно нужны свои собственные несистемные сертификаты в хроме, то им только винда с игрушками нужна и смартфоны, теперь вот наоборот только и нужно что супермодели тренировать.
    Когда уже люди будут говорить за себя, а не искать негров, которым срочно нужно помочь?
     
     
  • 5.54, Аноним (39), 16:48, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    спроси у сотрудника невидии выше
     

  • 1.24, frac (?), 13:34, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    мне одному кажется, что эти товарищи создадут дырень?
    возможно даже не дырень, а отверстие с молнией, которая будет прямиком картинки с секретами, явками и паролями кому надо отправлять.
     
     
  • 2.27, Аноним (27), 13:54, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    не больше, чем ethernet/IP.
     
     
  • 3.28, Аноним (29), 13:57, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    *ata/ethernet и usb/ip.
    Такие вещи в изолированных физически сетях включают. Сказали же - для кластера им нужно. У тебя есть кластер? Если есть, то и сеть выделенная для него есть. Если нет - то мимо. Так же, как и ata/ethernet делали для схд, а не для тебя.
     
     
  • 4.31, keydon (ok), 14:19, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну мне как бы и Device Memory TCP не нужен. Очень уж узкоспециализированное решение получается. Будет ли кто-нибудь кроме гугла его использовать? Может и не место ему в апстриме, пусть у себя на свое ядро патчи и накатывают и сами его поддерживают.
     
     
  • 5.34, Аноним (7), 14:32, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > мне как бы и Device Memory TCP не нужен

    Что ж ты раньше-то молчал? Пойду скажу пацанам из гугла, что могут закрывать свой RFC, что их усилия напрасны, так как Егорке из Саратова не нужно.

     
     
  • 6.47, Аноним2 (?), 15:32, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Гугл забыл передо мной отчитаться, вот и молчал.
     
  • 5.45, Аноним (45), 15:18, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    > Будет ли кто-нибудь кроме гугла его использовать?

    Будет ограниченное число владельцев своего AI. Вот они будут использовать. И продавать сервис другим.

    Покупка сервиса, вероятно, будет сродни современной покупке моб.связи.

    Запрыгивай с перона в вагон, поехали. Хотя,... тебе ж не нужно.

     
  • 3.37, Аноним (39), 14:58, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    как промышленный протокол ethernet/ip связан топиком и что через него должно утекать?
     
     
  • 4.82, Аноним (61), 22:57, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Когда хотел выпендриться, но не смог. Индустриальный протокол, про который ты только что вычитал в википедии, правильно называется EtherNet/IP и ты его ни разу в жизни не видел.
     
  • 2.44, freehck (ok), 15:14, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > мне одному кажется, что эти товарищи создадут дырень?

    да, они как раз и ковыряют специальную дырень, чтобы проталкивать в неё большие объёмы данных
    а сейчас у нас -- дырень слишком маленькая )

     

  • 1.35, Tron is Whistling (?), 14:33, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Очередная иоурина?
     
     
  • 2.66, YetAnotherOnanym (ok), 19:55, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Кстати, хорошая мысль. А ещё надо к этой штуке как-то прикрутить eBPF, для полноты счастья.
     

  • 1.55, Аноним (55), 16:55, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Я правильно понимаю, другими словами скорости передачи данных по самой сети уже ХВАТАЕТ, теперь узкое место это шина PCI?
     
     
  • 2.64, Аноним (61), 18:52, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Всё правильно понимаешь. Есть нюансы, но ты про них узнаешь когда-нибудь сам, не буду портить сюрприз.
     
  • 2.70, Аноним (70), 20:52, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ну еще потому что много посредников, причем кастомных.
     

  • 1.57, Аноним (57), 17:49, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Облачная видяха. Интересно сколько за гиг для геймеров можно будет арендовать.
     
     
  • 2.75, Аноним (70), 20:59, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Скорее видюха с сетевым разьемом
     
     
  • 3.76, Аноним (70), 21:07, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Дополнение: И это под лозунгом. чтобы в игры в облаке играть, фильмы в супер качестве смотреть, свой комп обучать из облака. (
    По факту - контроль за видео буфером и использование мощности gpu для обучения облачного ИИ.  
     

  • 1.62, Аноним (70), 18:46, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    брандмауэры, контроль трафика. сетевые фильтры и прочее подобное идут лесом?
     
     
  • 2.65, Аноним (61), 18:53, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Откуда в ML-кластере взялось всё это?
     
     
  • 3.68, Аноним (70), 20:46, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    подразумевался случай, когда два таких чипа найдут друг друга в сети общего назначения (как IoT)
     
     
  • 4.87, Аноним (61), 03:56, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Чем это отличается от двух любых других сетевых устройств, находящихся в одной сети «общего назначения»?
     

  • 1.63, Аноним (70), 18:48, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В рамках _внутренней_сети_кластера это может иметь смысл.
     
     
  • 2.67, YetAnotherOnanym (ok), 20:01, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Особый смысл будут иметь эксклюзивные компетенции Гугла по подготовке специально подготовленных наборов данных для ML.
     
     
  • 3.69, Аноним (70), 20:50, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Людей формируют по подготовленным паттернам в информационных технологиях. (
     
  • 3.77, Аноним (70), 21:22, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Подразумевалось не только ML, а что-то подобное _общая_память_кластера_
     

  • 1.71, Tron is Whistling (?), 20:52, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Не пора ли для таких вещей таки взять специализированные асики, ы?
     
     
  • 2.73, Аноним (70), 20:55, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    встроенные сетевухи есть везде. Остается открыть им прямой доступ к памяти. (
     
     
  • 3.74, Аноним (70), 20:57, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Дополнение: То есть убрать сетевой стэк.
     
  • 3.79, Tron is Whistling (?), 22:05, 13/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Тут не о памяти речь, а вообще о третьих устройствах.
    Коммуникация PCIe-PCIe в принципе возможна, почему бы для вот таких вот задач, которые нужны в 1.5 вырожденных случаях, не сваять простенький ASIC вместо тонны костылей в ядре.
     
     
  • 4.92, Аноним (22), 11:44, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Она не в принципе возможна, а работает man gdrcopy man gds и man dma-buf и к... большой текст свёрнут, показать
     
     
  • 5.110, Tron is Whistling (?), 09:13, 15/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Так-то так, но все эти дмабуфы всё равно требуют занятия root complex.
    Я про PtP, применение редкое, но в спецификации есть.
     
  • 5.111, Tron is Whistling (?), 09:14, 15/07/2023 [^] [^^] [^^^] [ответить]  
  • +/
    Ключевое слово тут было "мапит" - без root complex не обойтись. А оно в многослотовоых системах узкое место.
     

  • 1.72, Аноним (70), 20:53, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Вот работа гугл через добро.
     
  • 1.78, Аноним (78), 21:25, 13/07/2023 Скрыто ботом-модератором [﹢﹢﹢] [ · · · ]     [к модератору]
  • +/
     
  • 1.80, Аноним (81), 22:06, 13/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Ой, да это они лишь для своей Stadia хотят пропихнуть, не более.
     
     
  • 2.97, чатжпт (?), 13:32, 14/07/2023 [^] [^^] [^^^] [ответить]  
  • +1 +/
    с разморозкой, стадия уже упокоилась в январе этого года
     

  • 1.100, Аноним (100), 15:17, 14/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Гугл что-то последнее время ничего толкового не сделал. Багов в хроме столько детских, что даже не смешно уже. Ничего быстрого последнее время не делали, а только тормозное все. Вроде большая компания и сильные программеры, но в совокупности говно почему -то на выходе
     
  • 1.112, Аноним (112), 23:11, 15/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Что-то мне это напоминает очередной заход гугола к афедрону пользователя.
    Уд гугла стоит, а афедрон пользователя уже смазан рекламой)))))
     
  • 1.119, bOOster (ok), 06:11, 19/07/2023 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    А обычный аппаратный DMA слабо гуглу использовать? Опять "велосипед" необходим?

    Хотя гугл очередной раз изобретает... Но теперь уже PlayStation 3.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру