
2025년 11월 12일, OpenAI가 GPT-5 시리즈의 업그레이드 버전인 GPT-5.1을 공식 출시했습니다.

개인 로컬 PC의 Chrome을 사용하던 중 어느날 갑자기 "조직에서 관리하는 브라우저입니다" 라는 메시지가 뜨더라고요...

Lovable Cloud는 자연어 프롬프트만으로 데이터베이스, 인증, AI가 통합된 풀스택 앱을 5분 만에 생성합니다.

Google Cloud 생성형 AI 활용 사례가 18개월간 10배 폭증하며 실험 단계를 넘어 프로덕션 환경으로 진입했습니다. 14개 산업, 1,001개 기업 사례를 통해 AI 에이전트가 어떻게 비즈니스 가치를 창출하는지 데이터 기반으로 분석합니다.

Sora 2로 고품질 비디오를 생성하려면 5가지 핵심 요소를 마스터해야 합니다: 카메라 프레이밍, 피사계 심도, 액션 비트 분할, 조명과 팔레트, 피사체 세부사항 고정. 짧은 프롬프트는 창의성을, 긴 프롬프트는 정밀한 제어를 제공합니다.

Sora 2는 물리법칙을 정확히 구현하고 영상과 오디오를 동시 생성하는 차세대 AI 영상 생성 모델입니다. 혁신적인 Cameo 기능으로 본인을 어떤 장면에든 삽입할 수 있으며, 창작 중심의 소셜 앱으로 출시되어 새로운 형태의 디지털 커뮤니케이션을 제시합니다.

Claude Sonnet 4.5는 Anthropic이 2025년 9월 출시한 차세대 AI 모델로, SWE-bench Verified에서 77.2%를 달성하며 세계 최고 수준의 코딩 능력을 입증했습니다.

2025년 OpenAI GPT-5-Codex는 기존 "상세할수록 좋다"는 프롬프팅 상식을 뒤엎고 최소 프롬프트로 최대 효과를 내는 신개념을 제시했습니다.

MM-Grounding-DINO는 MMDetection 기반의 오픈소스 파이프라인으로, Grounding-DINO의 비공개 훈련 코드 한계를 극복하며 다양한 비전 작업을 효과적으로 수행하는 open-set detection 모델입니다.

본 연구에서는 large language model과 함께 각 이미지에 대한 image-level 상세 caption을 생성하여 co-training하는 open-vocabulary detector가 성능을 더욱 향상시킬 수 있음을 보여줍니다.

이번 포스팅은 NAVER Cloud AI DevDay 2025에서 다뤄진 발표, "지금 주목할 LLM 기술 흐름과 생성형 AI 적용 인사이트" (네이버클라우드 강지나 수석)를 정리한 내용입니다.

본 논문에서는 OVDEval 벤치마크의 두 주요 모델인 OmDet과 Grounding-DINO의 한계를 면밀히 분석하고, OmDet-Turbo를 소개합니다.

이 보고서에서는 개선된 실시간 Detection Transformer인 RT-DETRv2를 제시합니다. RT-DETRv2는 기존의 최신 실시간 detector인 RT-DETR을 기반으로 구축되었으며, 유연성과 실용성을 위한 bag-of-freebies를 도입합니다.

Gemini 2.5 Flash 이미지 생성을 위한 효과적인 프롬프팅 가이드 (https://developers.googleblog.com/ko/how-to-prompt-gemini-2-5-flash-image-generation-for-the-best-results/)

AI가 확신에 찬 거짓말을 하는 이유: ① 임의적 사실은 패턴 학습 불가능 ② 정확도 중심 평가가 추측 유도. 해결책은 "모르겠다"에 부분점수 주는 신뢰도 기반 평가로 전환하기.

기존의 Data Engineer, Data Scientist, ML Engineer 등의 역할에 더해, 5가지 새로운 AI 전문직이 주목받고 있습니다.

본 포스트는 'GPT-5에서 드러난 샘 알트만의 착각" 토크 내용을 정리한 내용입니다. 강수진 박사님(국내 프롬프트 엔지니어 공채 1호)이 직접 테스트한 GPT-5의 문제점과 실무 관점의 해결책을 다룹니다.

오늘 OpenAI는 API에서 가장 강력한 음성 대 음성 모델인 gpt-realtime을 출시하고 Realtime API의 일반 사용 가능성을 발표했습니다.

음성 인터페이스는 인간이 AI와 상호작용하는 가장 자연스러운 방식 중 하나입니다. 고객 지원부터 교육, 헬스케어까지 다양한 산업에서 인간 수준의 음성 품질을 가진 AI 경험에 대한 수요가 급증하고 있습니다.