Вернуться   Финляндия по-русски » Жизнь в Финляндии » Работа, образование, учеба
Логин
Пароль

Ответ
 
Опции темы Поиск в этой теме Рейтинг: Рейтинг темы: Голосов - 6, средняя оценка - 4.50. Опции просмотра
Old 05-02-2026, 21:38   #7561
lexer
Пользователь
 
Сообщений: 352
Проживание:
Регистрация: 21-04-2024
Status: Online
Цитата:
Сообщение от KiDr
Кстати я думаю скоро вот такие штуки будут более доступны.
https://www.nvidia.com/en-us/produc...ions/dgx-spark/

Ты цены на память видел?
 
0
 
0
    Ответить с цитированием
Old 05-02-2026, 22:03   #7562
KiDr
Пользователь
 
Аватар для KiDr
 
Сообщений: 39,948
Проживание: Siuntio
Регистрация: 23-02-2005
Status: Offline
Цитата:
Сообщение от lexer
Ты цены на память видел?

Видел, это сейчас бум, через пару лет бесплатно буду выдавать

-----------------
Думал я, думал, ничего полезного не придумал и решил наплевать!
 
0
 
0
    Ответить с цитированием
Old 05-02-2026, 22:25   #7563
lexer
Пользователь
 
Сообщений: 352
Проживание:
Регистрация: 21-04-2024
Status: Online
Talking

Цитата:
Сообщение от KiDr
Видел, это сейчас бум, через пару лет бесплатно буду выдавать

Если производители железа для консьюмеров к тому моменту по миру не пойдут)) А то будем все у дата-центров время арендовать с тонких клиентов.
А вообще, твои б слова... эх
 
0
 
0
    Ответить с цитированием
Old 06-02-2026, 16:18   #7564
Kluwert
Пользователь
 
Сообщений: 2,872
Проживание:
Регистрация: 23-02-2015
Status: Offline
Цитата:
Сообщение от KiDr
Кстати я думаю скоро вот такие штуки будут более доступны.
https://www.nvidia.com/en-us/produc...ions/dgx-spark/
А смысл?
 
0
 
0
    Ответить с цитированием
Old 06-02-2026, 16:40   #7565
KiDr
Пользователь
 
Аватар для KiDr
 
Сообщений: 39,948
Проживание: Siuntio
Регистрация: 23-02-2005
Status: Offline
Цитата:
Сообщение от Kluwert
А смысл?

Я лично ищу себе подходящий сервак чтобы ранить модели локали. я бы такую взял с удовольствием, но пока дороговато. До 2к можно найти не плохой вариант который будет ранить средний модели относительно быстро. Хочется чуть оживить дом. Так для интереса в основном

-----------------
Думал я, думал, ничего полезного не придумал и решил наплевать!
 
0
 
0
    Ответить с цитированием
Old 06-02-2026, 19:30   #7566
KiDr
Пользователь
 
Аватар для KiDr
 
Сообщений: 39,948
Проживание: Siuntio
Регистрация: 23-02-2005
Status: Offline
Кстати кто-то там говорил про контектс. Опус 4.6 недавно вышел, там какой-то заоблочный контекст. В принципе уже слишком большой
 
0
 
0
    Ответить с цитированием
Old 07-02-2026, 19:35   #7567
A19
Ползовател
 
Сообщений: 1,604
Проживание:
Регистрация: 22-04-2014
Status: Offline
Цитата:
Сообщение от KiDr
Кстати кто-то там говорил про контектс. Опус 4.6 недавно вышел, там какой-то заоблочный контекст. В принципе уже слишком большой


Я сам "фанат" Opus, что Gemini и Grok (и разные китайские модели) будут бодренько делать в несколько итераций (иногда в несколько десятков) - Opus сделает гораздо быстрее. OpenAI Codex не пробовал.

Но ради истины - у Claude еще с Sonnet 4 контекст 1 миллион. Sonnet 4.5 - миллион. Opus 4.5 был исключением.
Gemini - тоже давно до миллиона.
Grok 4 Fast - вообще до 2 миллионов.

В общем-то контекст в миллион-два уже давным-давно стандарт.

2 проблемы:
1) У них у у всех от примерно 200к контекста - отдельная цена (раза в 2 выше, причем далеко не всем дают доступ).
2) В подписку никто не включает расширенный контекст (миллиона вообще ни у кого нет). Исключение - самые дорогие Ultimate/Enterprise продажи фирмам, но и там пока "честные" 500к (при этом IDE всё равно пытается сжать всё ниже 200к)

Еще в больших контекстах известная проблема - модель хорошо понимает только начало и конец, середина меньше влияет на результат. Надеюсь, скоро это решат.

У локальных LLM скорость падает сильно при росте контекста.

Кто еще ни разу не пробовал и не хочет тратить деньги:

1) Gemini CLI или Antigravity, есть бесплатные лимиты на неделю (вот как раз на них недавно выяснял, как на Ultimate подписке - всё еще пробует ужать в 128к контекста.

2) OpenCode Zen ( https://opencode.ai/docs/zen/#pricing )
Бесплатные GLM 4.6, GLM 4.7, Minimax M2.1 и Kimi K2.5.
(в любой момент прервут, но для теста нормально).
 
0
 
0
    Ответить с цитированием
Old 07-02-2026, 20:05   #7568
KiDr
Пользователь
 
Аватар для KiDr
 
Сообщений: 39,948
Проживание: Siuntio
Регистрация: 23-02-2005
Status: Offline
Цитата:
Сообщение от A19
Я сам "фанат" Opus, что Gemini и Grok (и разные китайские модели) будут бодренько делать в несколько итераций (иногда в несколько десятков) - Opus сделает гораздо быстрее. OpenAI Codex не пробовал.

Но ради истины - у Claude еще с Sonnet 4 контекст 1 миллион. Sonnet 4.5 - миллион. Opus 4.5 был исключением.
Gemini - тоже давно до миллиона.
Grok 4 Fast - вообще до 2 миллионов.

В общем-то контекст в миллион-два уже давным-давно стандарт.

2 проблемы:
1) У них у у всех от примерно 200к контекста - отдельная цена (раза в 2 выше, причем далеко не всем дают доступ).
2) В подписку никто не включает расширенный контекст (миллиона вообще ни у кого нет). Исключение - самые дорогие Ultimate/Enterprise продажи фирмам, но и там пока "честные" 500к (при этом IDE всё равно пытается сжать всё ниже 200к)

Еще в больших контекстах известная проблема - модель хорошо понимает только начало и конец, середина меньше влияет на результат. Надеюсь, скоро это решат.

У локальных LLM скорость падает сильно при росте контекста.

Кто еще ни разу не пробовал и не хочет тратить деньги:

1) Gemini CLI или Antigravity, есть бесплатные лимиты на неделю (вот как раз на них недавно выяснял, как на Ultimate подписке - всё еще пробует ужать в 128к контекста.

2) OpenCode Zen ( https://opencode.ai/docs/zen/#pricing )
Бесплатные GLM 4.6, GLM 4.7, Minimax M2.1 и Kimi K2.5.
(в любой момент прервут, но для теста нормально).


ай м сори, но это для меня блабладавщина я лично пока ещё не упёрся в контекс. Вот так чтоб прям не хватало, может конечно вы там сразу геном человека грузите. Мне вполне пока хватает....

-----------------
Думал я, думал, ничего полезного не придумал и решил наплевать!
 
0
 
0
    Ответить с цитированием
Old 09-02-2026, 12:57   #7569
A19
Ползовател
 
Сообщений: 1,604
Проживание:
Регистрация: 22-04-2014
Status: Offline
Цитата:
Сообщение от KiDr
я лично пока ещё не упёрся в контекс. Вот так чтоб прям не хватало, может конечно вы там сразу геном человека грузите. Мне вполне пока хватает....

Да они (создатели всех этих средств разработки) просто постоянно находят, что бы еще в этот контекст запихать.
Вот и получается эта неприятность с ростом.
Если аккуратно контролировать то да, хватит.

Это я пишу, разглядывая результаты одного запроса в Claude Pro (22.5 в месяц). Попросил сделать review коммита.
Съел весь лимит сессии на 5 часов и 18% от месячного лимита. Остановился в процессе, так что что именно сделал и сделал ли - непонятно.

Через 4 часа узнаю, но пользоваться больше не буду.
 
0
 
0
    Ответить с цитированием
Ответ


Опции темы Поиск в этой теме
Поиск в этой теме:

Расширенный поиск
Опции просмотра Оценка этой теме
Оценка этой теме:

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

vB коды Вкл.
[IMG] код Вкл.
HTML код Выкл.



» Объявления на Doska.fi

» Галерея Финляндии

» Реклама на Doska.fi

» Реклама на Russian.fi


Часовой пояс GMT +3, время: 08:56.

Russian.fi - Финляндия по-русски © Suomitech Oy, 2002-2026 При использовании материалов с сайта указание ссылки на russian.fi обязательно