• LinkedIn
  • Telegram
  • FB
  • FB

Magazine Intelligenza Artificiale: l'IA è più di quello che appare

Tag: many-shot jailbreaking

Tag: many-shot jailbreaking

  • Gli studiosi di Anthropic scoprono come manipolare le risposte dell’IA

    Gli studiosi di Anthropic scoprono come manipolare le risposte dell’IA

    Gli studiosi di Anthropic hanno scoperto un nuovo metodo, chiamato “many-shot jailbreaking”, per indurre un modello linguistico AI a rispondere a domande inappropriate dopo essere stato esposto a numerose domande meno dannose.  Questo approccio sfrutta la capacità dei modelli LLM con ampie “finestre di contesto”, che tendono a performare meglio su molte attività se ci…