Understanding R1-Zero-Like Training: A Critical Perspective
https://github.com/sail-sg/understand-r1-zero
#HackerNews #Understanding #R1-Zero-Like #Training #Critical #Perspective #AI #Research #Machine #Learning

Understanding R1-Zero-Like Training: A Critical Perspective
https://github.com/sail-sg/understand-r1-zero
#HackerNews #Understanding #R1-Zero-Like #Training #Critical #Perspective #AI #Research #Machine #Learning
Hunyuan T1 Mamba Reasoning model beats R1 on speed and metrics
@paul_denton > Qu’ils renoncent à revenir sur la réforme des retraites
#R1 euh parce qu’ils ont vraiment eu l’intention de le faire ?
#R2 ah ben finalement elle était pas si nécessaire, et on va pouvoir redistribuer l’argent fait sur le dos des gens pour l’armée finalement ?
#R3 on n’est pas dans la panade…
Oh, look! Another tech babble-fest about "Reinforcement Learning" , as if AIs needed more encouragement to outsmart us. Apparently, integrating "cold-start data" makes machines think deeply
—who knew they could be so philosophical? #DeepSeek #R1 is clearly the Nietzsche of #AI, contemplating the meaning of life one algorithm at a time.
https://qwenlm.github.io/blog/qwq-32b/ #ReinforcementLearning #Philosophy #TechTrends #MachineLearning #HackerNews #ngated
Perplexity hat DeepSeek gesäubert.
Die chinesische #KI #DeepSeek #R1 sorgte für Aufsehen, da sie #OpenAI|s Modelle mit günstigerer Hardware erreichte.
Schnell kam #Kritik auf, da das Modell den chinesischen #Zensurgesetze|n entsprach und sensible Themen blockierte.
Das KI-Startup #Perplexity hat nun eine eigene Version namens #R11776 veröffentlicht, die frei von chinesischer #Propaganda und #Zensur sein soll. (1/2)
yes i am still using the unsafe-at-any-speed #rabbit #r1. the trick is to only tell it things and ask questions you're fine having submitted into evidence at your future trial.
regardless they have a cosmetics systems now where you get carrots for doing stuff and then you get to operate a machine and get a hat or something and today i got my first *rare* one, which is an #appleVisionPro headset apparently because it's called "Spacial Computer" and it's strapped on.
#ai #assistant
No m'ho puc creure: el Col·legi d'Enginyers de Camins creu que existeix la #crisiclimàtica! (Sort que a #LaVanguardiafòssil han esborrat això). I que no es podran salvar totes les platges. I que l'#R1 és l'elefant al litoral... #Maresme
Estudiants d’enginyeria de la UPF creen una aplicació per a informar en temps real sobre la R1 de Rodalia.
No millora el servei però ajuda a donar visibilitat als problemes.
https://www.vilaweb.cat/noticies/estudiants-enginyeria-upf-aplicacio-informar-temps-real-rodalies/
Spannendes „Reasoning“ von #Deepseek #R1 mit #Perplexity. Nur am Ende leider falsch. Tip: Wäre schön wenn „die KI“ wüsste wie man einen Geochecker bedient.
LM Studio: Faîtes tourner facilement DeepSeek-R1 en local
https://cryptrz.org/wordpress/2025/02/04/lm-studio-faites-tourner-facilement-deepseek-r1-en-local/
How To Setup DeepSeek-R1 LLM AI ChatBot Using Ollama On An Ubuntu Linux GPU Cloud Server (VPS) https://youtu.be/S_JEkuE9EyU #Websplaining #DeepSeek #DeepSeekAI #R1 #DeepSeekR1 #DigitalOcean #ReasoningModel #LLM #AI #GPU #GpuServer #DistilledAIModel #GpuDroplet
#Deepseek #R1 wohl für so ziemlich jeden #KI-#Jailbreak anfällig.
Neue #Jailbreaks stellen #KI-Unternehmen immer wieder vor neue Herausforderungen. Deepseek scheint sich nicht groß darum zu kümmern.
How to Run DeepSeek R1 671B Locally on a $2000 EPYC Server: https://digitalspaceport.com/how-to-run-deepseek-r1-671b-fully-locally-on-2000-epyc-rig/ #linux #llm #deepseek #r1 #epyc #server #selfhosted