profile
Always be passionate ✨
post-thumbnail

공식 Sora 2 프롬프팅 가이드: 성공적인 비디오 생성을 위한 실전 전략

Sora 2로 고품질 비디오를 생성하려면 5가지 핵심 요소를 마스터해야 합니다: 카메라 프레이밍, 피사계 심도, 액션 비트 분할, 조명과 팔레트, 피사체 세부사항 고정. 짧은 프롬프트는 창의성을, 긴 프롬프트는 정밀한 제어를 제공합니다.

7일 전
·
0개의 댓글
·
post-thumbnail

OpenAI DevDay 2025 전체 발표 정리

샌프란시스코 Fort Mason에서 OpenAI DevDay 2025가 개최되었습니다.

7일 전
·
0개의 댓글
·
post-thumbnail

Sora 2 출시: 영상 생성 AI의 새로운 패러다임

Sora 2는 물리법칙을 정확히 구현하고 영상과 오디오를 동시 생성하는 차세대 AI 영상 생성 모델입니다. 혁신적인 Cameo 기능으로 본인을 어떤 장면에든 삽입할 수 있으며, 창작 중심의 소셜 앱으로 출시되어 새로운 형태의 디지털 커뮤니케이션을 제시합니다.

2025년 10월 1일
·
0개의 댓글
·
post-thumbnail

Antrophic, Claude Sonnet 4.5, 차세대 AI 모델 공개

Claude Sonnet 4.5는 Anthropic이 2025년 9월 출시한 차세대 AI 모델로, SWE-bench Verified에서 77.2%를 달성하며 세계 최고 수준의 코딩 능력을 입증했습니다.

2025년 9월 29일
·
0개의 댓글
·
post-thumbnail

GPT-5-Codex 완벽 가이드: AI 코딩 에이전트의 새로운 패러다임

2025년 OpenAI GPT-5-Codex는 기존 "상세할수록 좋다"는 프롬프팅 상식을 뒤엎고 최소 프롬프트로 최대 효과를 내는 신개념을 제시했습니다.

2025년 9월 29일
·
0개의 댓글
·
post-thumbnail

[Paper Review] MM-Groundung-DINO : An Open and Comprehensive Pipeline for Unified Object Grounding and Detection

MM-Grounding-DINO는 MMDetection 기반의 오픈소스 파이프라인으로, Grounding-DINO의 비공개 훈련 코드 한계를 극복하며 다양한 비전 작업을 효과적으로 수행하는 open-set detection 모델입니다.

2025년 9월 15일
·
0개의 댓글
·
post-thumbnail

[Paper Review] LLM-Det : Learning Strong Open-Vocabulary Object Detectors under the Supervision of Large Language Models

본 연구에서는 large language model과 함께 각 이미지에 대한 image-level 상세 caption을 생성하여 co-training하는 open-vocabulary detector가 성능을 더욱 향상시킬 수 있음을 보여줍니다.

2025년 9월 15일
·
1개의 댓글
·
post-thumbnail

[정리] 지금 주목할 LLM 기술 트렌드와 생성형 AI 적용 전략 - Naver Cloud

이번 포스팅은 NAVER Cloud AI DevDay 2025에서 다뤄진 발표, "지금 주목할 LLM 기술 흐름과 생성형 AI 적용 인사이트" (네이버클라우드 강지나 수석)를 정리한 내용입니다.

2025년 9월 14일
·
0개의 댓글
·
post-thumbnail

[Paper Review] OmDet_Turbo : Real-time Transformer-based Open-Vocabulary Detection with Efficient Fusion Head

본 논문에서는 OVDEval 벤치마크의 두 주요 모델인 OmDet과 Grounding-DINO의 한계를 면밀히 분석하고, OmDet-Turbo를 소개합니다.

2025년 9월 14일
·
0개의 댓글
·
post-thumbnail

[Paper Review] RT-DETRv2: Improved Baseline with Bag-of-Freebies for Real-Time Detection Transformer

이 보고서에서는 개선된 실시간 Detection Transformer인 RT-DETRv2를 제시합니다. RT-DETRv2는 기존의 최신 실시간 detector인 RT-DETR을 기반으로 구축되었으며, 유연성과 실용성을 위한 bag-of-freebies를 도입합니다.

2025년 9월 14일
·
0개의 댓글
·
post-thumbnail

[정리] 구글의 나노바나나 프롬프트 공식 공개하다

Gemini 2.5 Flash 이미지 생성을 위한 효과적인 프롬프팅 가이드 (https://developers.googleblog.com/ko/how-to-prompt-gemini-2-5-flash-image-generation-for-the-best-results/)

2025년 9월 9일
·
0개의 댓글
·
post-thumbnail

[OpenAI] 언어모델 환각(Hallucination) 현상: 왜 AI는 확신에 찬 거짓말을 할까?

AI가 확신에 찬 거짓말을 하는 이유: ① 임의적 사실은 패턴 학습 불가능 ② 정확도 중심 평가가 추측 유도. 해결책은 "모르겠다"에 부분점수 주는 신뢰도 기반 평가로 전환하기.

2025년 9월 7일
·
0개의 댓글
·
post-thumbnail

[정리] AI가 창출하는 5가지 새로운 직업과 전문가 되는 방법

기존의 Data Engineer, Data Scientist, ML Engineer 등의 역할에 더해, 5가지 새로운 AI 전문직이 주목받고 있습니다.

2025년 9월 6일
·
0개의 댓글
·
post-thumbnail

[정리] GPT-5 ‘원사이즈 핏’의 착각과 골디락스 프롬프트

본 포스트는 'GPT-5에서 드러난 샘 알트만의 착각" 토크 내용을 정리한 내용입니다. 강수진 박사님(국내 프롬프트 엔지니어 공채 1호)이 직접 테스트한 GPT-5의 문제점과 실무 관점의 해결책을 다룹니다.

2025년 9월 5일
·
0개의 댓글
·
post-thumbnail

[OpenAI][번역] Realtime Prompting Guide

오늘 OpenAI는 API에서 가장 강력한 음성 대 음성 모델인 gpt-realtime을 출시하고 Realtime API의 일반 사용 가능성을 발표했습니다.

2025년 8월 31일
·
0개의 댓글
·
post-thumbnail

[OpenAI] GPT Realtime API: 음성 기반 AI 에이전트의 새로운 전환점

음성 인터페이스는 인간이 AI와 상호작용하는 가장 자연스러운 방식 중 하나입니다. 고객 지원부터 교육, 헬스케어까지 다양한 산업에서 인간 수준의 음성 품질을 가진 AI 경험에 대한 수요가 급증하고 있습니다.

2025년 8월 31일
·
0개의 댓글
·
post-thumbnail

[Paper Review] EXAONE Path 2.0: Pathology Foundation Model with End-to-End Supervision

PYEON, Myeongjang, et al. EXAONE Path 2.0: Pathology Foundation Model with End-to-End Supervision. arXiv preprint arXiv:2507.06639, 2025.

2025년 8월 29일
·
0개의 댓글
·
post-thumbnail

[Paper Review] EXAONE Deep: Reasoning Enhanced Language Models

RESEARCH, L. G., et al. EXAONE Deep: Reasoning Enhanced Language Models. arXiv preprint arXiv:2503.12524, 2025.

2025년 8월 29일
·
0개의 댓글
·
post-thumbnail

[Paper Review] EXAONE 3.5: Series of Large Language Models for Real-world Use Cases

AN, Soyoung, et al. EXAONE 3.5: Series of Large Language Models for Real-world Use Cases. arXiv e-prints, 2024, arXiv: 2412.04862.

2025년 8월 29일
·
0개의 댓글
·
post-thumbnail

[Paper Review] EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes

RESEARCH, L. G., et al. EXAONE 4.0: Unified Large Language Models Integrating Non-reasoning and Reasoning Modes. arXiv preprint arXiv:2507.11407, 2025

2025년 8월 29일
·
0개의 댓글
·