• farsinuce@feddit.dk
    link
    fedilink
    arrow-up
    3
    ·
    edit-2
    8 months ago

    Ja, det kommer også an på hvilken data de individuelle LLMs bliver trænet på. Jeg mindes, at Claude.ai for eksempel er trænet mere på data fra artikler fremfor data fra online fora.

    Så spredehaglssprogmodeller bliver muligvis dem, der kommer til at lide mest.

    • letraset@feddit.dkOP
      link
      fedilink
      arrow-up
      2
      ·
      8 months ago

      Det er i hvert fald ret vigtigt, at materialet der bruges til at træne de her LLMs ikke består af LLM genereret indhold, og det er vist stadig ret svært at afgøre hvad der er, og ikke er, genereret af LLMs. Det kommer, forhåbentlig hen ad vejen.