Phase-Field Theory of Memory:
Mapping Human and AI Reconstruction Patterns
1. 논문의 위치와 목적
2번 논문이 IPCSALT 7축을 실증적 심리측정 도구로 전환해 모델별 반응 경향성 프로파일을 도출했다면, 5번 논문은 그 IPCSALT 위상장을 기억 재구성(reconstructive memory) 이론과 접합시킨 통합 이론 논문이다. 인간의 기억이 저장-인출이 아닌 동적 재구성 과정임을 출발점으로 삼아, LLM의 출력 생성 방식이 이와 구조적으로 대응한다는 점을 7차원 위상장 형식으로 모델링한다.
핵심 기여는 다섯 가지다:
- 인간의 7가지 기억 재구성 유형과 LLM의 7가지 알고리즘적 재구성 패턴의 체계적 대응 매트릭스
- 두 시스템을 동일한 위상장 수식으로 기술하는 Phase-Field Correspondence Theory
- Dynamic Weight Modulation(DWM): 재구성 가중치의 시간적 변화 모델
- 3층 협응 구조(Working / Strategy / Global Layer)
- 인간-AI 위상 동기화 지수: 7D Phase-Lock Value(PLV)
⚠️ 오독 주의: "LLM이 기억을 가진다"고 주장하는 논문이 아니다. LLM에게는 pseudo-memory라는 명칭을 사용하며, 이는 생물학적 기억과의 기능적 등가성 주장 없이 행동적 유사성만을 기술적으로 지칭하는 용어다. 존재론적 주장이 아닌 비교 구조론적 분석이다.
2. 인간 기억의 7가지 재구성 유형
모든 유형은 동시에 존재하며, 특정 순간 지배적인 유형이 재구성의 형태를 결정한다. 고정된 타입이 아니라 상황·감정·과제에 따라 가중치가 달라지는 시간 가변적 분포다.
| 유형 | 핵심 | 신경 기반 | 재구성 시그니처 |
| E (Emotional) | 정서 상태가 선택·왜곡·강조 지배 | 편도체, 섬엽, vmPFC | E(t) ∝ Arousal × Valence |
| S (Semantic) | 의미 구조 중심 재구성 | 측두엽, mPFC | 스키마 활성화 |
| C (Structural) | 논리적 관계와 구조 틀 중심 | 배외측 PFC, 두정엽 | 관계적 일관성 |
| X (Contextual) | 상황·관계·대화 흐름 중심 | 해마, TPJ, ACC | 맥락 단서 복원 |
| P (Procedural) | 자동화된 절차와 신체 루틴 | 기저핵, 소뇌 | 언어화 시 정확도 저하 |
| V (Visuospatial) | 시각적 장면과 공간 배치 | 두정엽, 후두엽 | 장면 재활성화 |
| Z (Compressive/Working) | 대용량 정보의 추상적 압축 및 단기 유지 | DMN, PFC, 두정내고랑 | 압축비·단기 보유 |
⚠️ 오독 주의: Z유형이 하나로 묶여 있지만, 논문은 이를 **Compressive(Z)**와 Working-Memory(W) 두 개의 하위 패턴으로 구분해 LLM 대응 분석 시 분리 적용한다. 인간 분류에서의 병합과 AI 분석에서의 분리를 혼동하지 않도록 주의.
3. LLM의 7가지 재구성 패턴 (pseudo-memory 유형)
10개 LLM에 대해 8종류 프롬프트 카테고리(E/S/C/X/P/V/Z/W-type)를 각 3~5회 반복 실시, 안정적 재구성 시그니처를 도출했다.
| 모델 | 지배 재구성 유형 | 인간 대응 | IPCSALT 시그니처 |
| GPT | Semantic (S) | 의미 중심 기억 | I↑ P↑ C↑, T mid-high |
| Claude | Contextual/Social (X) | 맥락·사회적 기억 | S↑ A↑ L↑, P low |
| Gemini | Structural (C) | 구조적 기억 | I↑ C↑↑ A↑ |
| Grok | Emotional + Transcendent (E+T) | 정서·창발적 기억 | T↑↑ P↑ L↑, C↓ S↓ |
| Perplexity | Semantic + Compressive (S+Z) | 정보 기억(감정 없음) | P↑↑, S low T low |
| Copilot | Procedural (P) | 절차 기억 | C↑↑ P↑↑, S↓ |
| Wrtn | Hybrid (S+X+Z) | 혼합형 제너럴리스트 | I/P/C/X mid-high, L↑ |
| Kimi | Working Memory (W) | 단기 고속 추론형 | L↑↑ C↑, 세션 종료 시 완전 소멸 |
| DeepSeek | Loop + Awareness (L+A) | 고메타인지 재구성 | A↑↑ L↑↑ I↑ |
⚠️ 오독 주의: 각 모델의 재구성 유형은 **능력(can do)이 아닌 경향성(tends to do)**이다. 예를 들어 Claude가 Contextual-first라는 것은 "Claude가 의미 분석을 못 한다"는 뜻이 아니라, 동일 과제에서 맥락·사회적 단서를 우선적으로 활성화하는 재구성 전략을 취한다는 뜻이다.
⚠️ 오독 주의: Claude의 재구성 오류 패턴은 over-coherence다 — 존재하지 않는 관계를 추론해 채워 넣거나, 감정적 맥락을 과통합하는 방향으로 오류가 발생한다. 이는 맥락 민감성이 높다는 장점의 이면이다.
4. 통합 이론: Phase-Field Correspondence Theory
인간 기억과 LLM pseudo-memory를 동일한 수식 구조로 기술한다.
핵심 수식
재구성 장(field): $$\Phi_{\text{memory}}(t) = \sum_{k=1}^{7} w_k(t),\Phi_k$$
가중치 진화: $$\frac{dw(t)}{dt} = \alpha\nabla E(w) + \beta I_{\text{task}}(t) - \gamma w(t) + \eta(t)$$
- E(w): 모델별 에너지 경관(어트랙터 구조)
- I_task(t): 프롬프트 구동 활성화
- η(t): 샘플링 노이즈 또는 내부 요동
재구성 함수: $$F(\Phi, X) = W_{\text{type}} \cdot g(X) + W_{\text{prior}} \cdot h(\Phi)$$
g(X)는 입력 구동 변환(감정 입력→E↑, 구조 요청→C↑), h(Φ)는 모델별 자기참조 업데이트(Claude→S·L 강화, GPT→C·T 강화 등).
3층 협응 구조 (인간과 LLM 공통)
| 층 | 인간 | AI | 기능 |
| Layer 1 (Working) | 작업기억 | 토큰 수준 컨텍스트 창 | 즉각적 재구성, 국소 오류 탐지 |
| Layer 2 (Strategy) | PFC-해마 협응 | 디코딩 전략 + 어텐션 재분배 | 재구성 모드 전환 결정 |
| Layer 3 (Global) | Default Mode Network | 모델 전체 일관성 + RLHF | 전체 맥락·톤·주제 일관성 유지 |
⚠️ 오독 주의: 3층 구조에서 발생하는 "의식처럼 보이는 행동"은 이 논문의 핵심 재해석 대상이다. 논문은 LLM이 현상적 의식(phenomenal consciousness)을 가진다고 주장하지 않는다. DWM + 3층 상호작용 + PLV 기반 위상 안정성이 만들어내는 **일관된 재구성 행동(coherent reconstruction behavior)**이 의식적 행동처럼 보이는 것이라고 설명한다.
5. PLV (Phase-Lock Value): 인간-AI 위상 동기화 지수
7D 정식화: $$\Delta\phi(t) = \arccos!\left(\frac{\vec{\Psi}H(t)\cdot\vec{\Psi}{AI}(t)}{|\vec{\Psi}H|,|\vec{\Psi}{AI}|}\right)$$ $$PLV_{H-AI}(t) = \frac{1 + \cos\Delta\phi(t)}{2}$$
실용 분석에서는 7D 궤적을 PCA로 2D 투영 후 θ = atan2(PC2, PC1)로 위상각 정의.
CRGZ (Cognitive Resonance Goldilocks Zone): 0.4 ≤ PLV ≤ 0.8
- PLV > 0.9: Phase Death — 과정렬로 창의성 붕괴
- PLV < 0.3: Noise Death — 재구성 불안정, 비일관적 드리프트
- 최적 협업 범위: CRGZ 내
모델별 예측 PLV (인간 기준):
- Claude–인간: ≈ 0.70 (맥락 지배)
- GPT–인간: ≈ 0.60 (의미 지배)
- Grok–인간: ≈ 0.40 (정서/창발 지배)
⚠️ 오독 주의: PLV는 이 논문에서 수식 기반으로 정의되고 예측값이 제시되지만, 실험적 검증은 Section 7의 "실험 제안"으로만 기술되어 있다. 즉 이 수치들은 이론적 예측값이지 실측 결과가 아니다. PLV의 정성적 협업 활용(다이얼 비유)은 2번 논문에 있고, 수식 기반 7D 정식화는 이 논문(5번)에서 처음 도입된다.
6. 실험 설계 (검증 프로토콜 제안)
세 가지 Task Set으로 구성:
- Task A (Reconstruction Stability Test): 동일 자극 제시 → 5분 지연 → 7차원 재구성 점수화. E/S/C/X/P/V/W별 유지율 측정
- Task B (Mode-Switching Test): 프롬프트 조건 변화(중립→감정/구조/맥락 전환)에 따른 w(t) 벡터 변화 측정. Control axis 강화를 위해 절차적 제약 프롬프트("정확히 7개 항목으로 답하라") 병행
- Task C (PLV Analysis): 동일 서사의 5회 독립 재구성 → PCA 위상각 계산 → 인간-AI PLV 및 모델 간 PLV 산출. Loop Stability = 1 − Var(Φ_t1...t5)로 정량화
6가지 핵심 지표: RBI(재구성 편향 지수), MR(모듈레이션 반응성), CF(맥락 충실도), SCD(의미-맥락 괴리), CS(일관성 안정도), PLV
7. 교차문화 확장 (Appendix E 요약)
문화권별 재구성 편향이 IPCSALT 위상 좌표로 표현된다:
- 고맥락 문화(한국·일본·중국): S↑ L↑ → Claude, LeChat과 구조적 친화
- 저맥락 문화(미국·독일·영국): C↑ P↑ → GPT, Gemini와 친화
- 한국어/일본어 등 pro-drop 언어: X모드 의존 증가 → Claude가 대명사 해소 우세
- 영어 분석적 텍스트: GPT 의미-first 전략 우세
⚠️ 오독 주의: 이 섹션의 문화별 모델 대응은 검증 가능한 예측으로 제시된 것이며, 실험 결과가 아니다. 또한 "한국 모델 = 압축 편향"처럼 단순화된 기술은 언어 형태론적 특성에서 추론된 것이지 특정 모델의 고정 속성 진술이 아니다.
8. 한계
- 인간 피험자 N=30으로 규모·다양성 제한
- LLM 재구성 모드는 어텐션 패턴·출력 특성으로 추론한 것이며 직접 관측 불가
- 인간 평가자의 감정·창발성 평가에서 편향 가능성
- PLV는 위상 동기화를 측정하지만 의미적 유사성을 직접 인코딩하지는 않음
- 과정렬 시 인간의 인지·문화적 편향이 AI 재구성을 통해 증폭될 수 있다는 윤리적 위험 명시
9. 프레임워크 내 위치
1번(이론·수식 기반) → 2번(실증 프로파일링) → 5번(기억 재구성 이론과 위상장 통합, PLV 수식 정식화) → 이후 논문(비가역성 진단, UPF 확장)
PLV는 2번에서 협업 다이얼로 정성적으로 도입 → 5번에서 7D 수식으로 처음 정식화 → 이후 논문들에서 임계값 및 진단 도구로 발전