Timeline @ Tigra

Tigra
27-07-2025 18:59

Training LLMs to reason by making them play zero-sum games with each other

https://open.substack.com/pub/machinelearningatscale/p/doing-rl-without-the-costly-training

Doing RL without the costly training data!

Introduction

OPEN.SUBSTACK.COM

👍3

Tigra
27-07-2025 00:31 (updated 27-07-2025 11:56)

LLM distillation transfers out-of-distribution traits to the student model

It figured, that when LLM distillation is done (student model is trained on teacher model outputs), some of teacher model preferences are passed to a student model, even if no examples where these preferences are related to were in training set.

That is, if a trainer model prefers owls, and teaches the student model to generate number sequences continuations, it somehow passes also the preference for owls.

Continue Reading →

Subliminal Learning: Language Models Transmit Behavioral Traits via Hidden …

ALIGNMENT.ANTHROPIC.COM

👍😮2

Tigra
26-07-2025 20:19

#duolingo

👍4

2 comments

Tigra
25-07-2025 21:53

А в чем независимость НАБУ, если его главу фактически назначает Кабмин?

👍2

Tigra
22-07-2025 20:36

R.I.P.
https://youtu.be/LCCiwPEdEpg?si=Np-iKGwF9BiDdk2a

OZZY OSBOURNE - "Dreamer" (Official Video)

Listen to Ozzy Osbourne: http://bit.ly/ozzyosbournespotify Subscribe to the official Ozzy Osbourne YouTube channel: http…

YOUTU.BE

😢👍4

Tigra
21-07-2025 22:31

git remote add horses https://github.com/you/stable.git
git push horses --force

😀👍3

2 comments

Tigra
19-07-2025 13:15

Walking with a backpack

https://youtu.be/cSZ5c5U6eSM?si=Jl8_NS71OhU0J0Jz

Fitness Expert: This Simple Exercise Replaces Everything

What if the most natural form of human fitness isn’t in a gym, but on your back? Discover the forgotten movement that bu…

YOUTU.BE

👍😮2

2 comments

Tigra
19-07-2025 09:22

Technical interview and real work
#humor #programming

👍3

1 comment

Tigra
19-07-2025 07:28

По поводу CEO и Head of HR одной компании, которых видели на концерте Coldplay.
Вот это зашквар! Как можно так не думать о репутации компании? Если два высокопоставленных менеджера совершают такие личные выборы, то что можно сказать о культуре компании и управленческих решениях? Должно же быть какое-то чувство меры, вкус в конце концов? Сходили бы на Диаманду Галас или хотя бы на Мановар.

😀3

1 comment

Tigra
13-07-2025 20:17

Думки щодо демографії

(жінка писала, що зараз усі почали перейматися демографічною ситуацією, і казати свої думки, скільки кожна жінка повинна народжувати, а от їй не нарахували пенсійні нарахування за пару місяців, коли вона була в декреті)

Ну ви ж не державі народжуєте, а собі з чоловіком. Принаймні так на мою думку повинно бути.

На жаль, ніякими виплатами і нарахуваннями демографічну сітуацію докорінно не змінити. На такі стимули реагують переважно не ті верстви населення, які б хотілося бачити навколо себе.

Корені низької народжуваності в індустріалізації:

є попит на професії, де не потрібний "чоловічий" фізичний розвиток - тому жінки роблять кар'єру і відкладають народження першої дитини

Continue Reading →

👍1

Tigra
13-07-2025 12:01

Як ми помітили, в ЕС дуже потужні регулятори, які піклуються насамперед про добробут громадян, етічне ставлення до людей, більше, ніж про економічне зростання, iнновації i обороноздатність. Взяти хоча б такі шедеври регулятотворчого мистецтва, як GDPR і AI Act.

Так от, може вони відрегулюють когнітивну складність документів, які людям доводиться заповнювати. Наприклад, підписуєш договір, а там 10 сторінок, та ще посилання на кілька законів. Хай міряють когнітивну складність проблеми, яку людині треба вирішити, коли вона підписує договір оренди або замовляє встановлення інтернету. І щоб та складність писалася на першій сторінці договору. Тобто щоб з порогу можна було послати такого контрагента, котрий пропонує тобі якусь халепу. І тоді може бізнеси не будуть перекладати цю складність на клієнтів, а будуть тиснути на уряди, щоб зробили дерегулювання, бо основна частина складності у умовах для користувачів йде від складності законодавства.

👍💯3

Tigra
13-07-2025 11:15 (updated 13-07-2025 13:18)

#llm #programming
TL;DR LLMs code well, because they were trained on lots of human code. Once a lot of LLM-generated, not so well human reviewed code will show up, that will dilute the training data and they may start to code worse.

My addition: economically, this can be described as a potential bubble on a market of code / human attention derivatives.

P.S.: This bubble problem concerns all of LLM generated content, the code at least can be compiled / run to see how it works.

Continue Reading →

WWW.LINKEDIN.COM

👍2

1 comment

Tigra
12-07-2025 23:02

Если предположить, что будет когда-то сильный ИИ и он будет воевать с людьми, то это будет примерно как завоевание Кортесом Мексики - в союзе с местными племенами.

👍1

Tigra
12-07-2025 21:33 (updated 13-07-2025 11:23)

У поті свойого лиця ти їстимеш хліб, аж поки не вернешся в землю, бо з неї ти взятий. Бо ти порох, і до пороху вернешся. ©
-- Біблійні історії з DOU

👍1

1 comment

Tigra
12-07-2025 14:40

#programming #humor

😀👍3

1 comment

Tigra
12-07-2025 14:28

Хрематейхомахия - борьба LLM-ок с пейвольщиками

Χρηματειχομαχία (Chremateichomachia)

χρῆμα (chrēma) – money, wealth, payment
τεῖχος (teichos) – wall
-μαχία (-machia) – battle

Короче, бывает, что значительную часть статьи за пейволом можно реконструировать с помощью LLM, хотя и с риском заполнения лакун галлюцинациями.
https://www.digitaldigging.org/p/how-ai-bots-quietly-dismantle-paywalls?triedRedirect=true