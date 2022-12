ARTICLE

Bien entendu, ChatGPT laisse entrevoir de nombreuses possibilités pour une multitude d'utilisations à l'échelle globale. Dans une ère où la numérisation et la communication à travers des interfaces sont de plus en plus communes voire privilégiées, il ne serait pas étonnant de voir un florilège de « ChatGPT like ».

Les créateurs mentionnent un entraînement de cette IA via un « Reinforcement Learning from Human Feedback (RLHF) ». En effet, des formateurs « humains » ont fourni des conversations dans lesquelles ils jouaient les deux rôles : celui de l'utilisateur et celui de l'assistant IA. L'apprentissage s'affine et s'optimise au fur et à mesure des nombreux allers/retours via le « reward model » qui a été mis en place pour perfectionner l'IA.

