| 번호 | 청구항 |
|---|---|
| 1 | 기지국, 플라잉 지능형 반사면(Flying Intelligent Reflecting Surface: F-IRS), 및 복수의 사용자 단말을 포함하는 통신 시스템의 통신 방법이고, 하나 이상의 프로세서들, 및 상기 하나 이상의 프로세서들에 의해 실행되는 하나 이상의 프로그램들을 저장하는 메모리를 구비한 컴퓨팅 장치에서 수행되는 통신 방법으로서, 기지국에서 송신한 신호를 플라잉 지능형 반사면을 통해 사용자 단말이 수신하는 경우 상기 사용자 단말의 수신 신호를 산출하는 단계; 및상기 수신 신호에 기초한 상기 사용자 단말의 ASSR(Achievable System Sum Rate)을 최대화 하도록 상기 플라잉 지능형 반사면의 기 설정된 파라미터들을 최적화 하는 단계를 포함하고, 상기 최적화 하는 단계는, 하기 수학식 및 F-IRS의 행동 공간의 제약 조건을 통해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하되, 상기 최적화 하는 단계는, 심층 강화 학습 모델을 이용한 알고리즘에 의해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하는 것으로, 각 타임 슬롯 t에서 F-IRS의 위치 정보와 사용자 단말의 위치 정보를 포함하는 상태 s(t)에 대한 정보를 상기 심층 강화 학습 모델로 입력하여 상기 상태 s(t)에 대응하는 행동 a(t)을 결정하도록 하며, 상기 행동 a(t)는 해당 타임 슬롯의 플라잉 지능형 반사면의 파라미터(,)를 포함하는, 통신 방법.(수학식)(F-IRS의 행동 공간의 제약 조건): 타임 슬롯 t에서 F-IRS가 움직이는 시간: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 방위각: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 고도각: 타임 슬롯 t에서 F-IRS의 반사 소자 n에서의 위상 천이 값Rk : 사용자 단말에서 달성 가능한 비율(Achievable Rate)K : 사용자 단말의 전체 개수n : F-IRS의 반사 소자 |
| 2 | 삭제 |
| 3 | 삭제 |
| 4 | 청구항 1에 있어서, 상기 최적화 하는 단계는, 상기 F-IRS의 행동 공간의 제약 조건을 하기 수학식을 통해 정규화하여 정규화된 행동 a(t)를 산출하는 단계를 더 포함하는, 통신 방법.(수학식)여기서, 는 를 각각 정규화하기 위한 행동 변수(정규화 행동 변수) 임. |
| 5 | 청구항 4에 있어서, 상기 최적화 하는 단계는, 상기 정규화된 행동 a(t)을 매핑 함수(mapping function)에 입력하여 상기 정규화된 행동에 포함된 정규화 행동 변수들을 각각 기 정의된 매핑 값으로 변환하는 단계를 더 포함하는, 통신 방법. |
| 6 | 청구항 5에 있어서, 상기 매핑 값은, 제1 매핑 값, 제2 매핑 값, 제3 매핑 값, 및 제4 매핑 값을 포함하고, 상기 제1 매핑 값()은, 타임 슬롯 t에서 F-IRS가 움직이는 시간에 대한 정규화 행동 변수인 의 매핑 값으로 하기 수학식으로 정의되고, 상기 제2 매핑 값()은, 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 고도각에 대한 정규화 행동 변수인 의 매핑 값으로 하기 수학식으로 정의되며, 상기 제3 매핑 값()은, 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 방위각에 대한 정규화 행동 변수인 의 매핑 값으로 하기 수학식으로 정의되고, 상기 제4 매핑 값()은, 타임 슬롯 t에서 F-IRS의 반사 소자 n에서의 위상 천이 값에 대한 정규화 행동 변수인 의 매핑 값으로 하기 수학식으로 정의되는, 통신 방법. |
| 7 | 청구항 6에 있어서, 상기 최적화 하는 단계는, 상기 매핑 함수에서 정규화된 행동에 대한 매핑 값을 출력하는 경우, 상기 정규화된 행동에 대한 매핑 값을 F-IRS로 전달하여 상기 정규화된 행동에 대한 매핑 값에 따른 행동을 취하도록 하는 단계; 상기 F-IRS가 취한 행동에 대한 보상을 획득하는 단계;상기 F-IRS 및 상기 사용자 단말로부터 다음 타임 슬롯의 상태 s(t+1) 정보를 획득하는 단계; 및 상기 정규화된 행동에 대한 매핑 값에 대응하는 경험 정보를 리플레이 버퍼에 저장하는 단계를 더 포함하는, 통신 방법. |
| 8 | 하나 이상의 프로세서들; 메모리; 및 하나 이상의 프로그램들을 포함하고,상기 하나 이상의 프로그램들은 상기 메모리에 저장되고, 상기 하나 이상의 프로세서들에 의해 실행되도록 구성되며, 기지국, 플라잉 지능형 반사면(Flying Intelligent Reflecting Surface: F-IRS), 및 복수의 사용자 단말을 포함하는 통신 시스템의 통신 방법을 수행하기 위한 컴퓨팅 장치로서, 상기 하나 이상의 프로그램들은, 기지국에서 송신한 신호를 플라잉 지능형 반사면을 통해 사용자 단말이 수신하는 경우 상기 사용자 단말의 수신 신호를 산출하기 위한 명령; 및상기 수신 신호에 기초한 상기 사용자 단말의 ASSR(Achievable System Sum Rate)을 최대화 하도록 상기 플라잉 지능형 반사면의 기 설정된 파라미터들을 최적화 하기 위한 명령을 포함하고, 상기 최적화 하기 위한 명령은, 하기 수학식 및 F-IRS의 행동 공간의 제약 조건을 통해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하되, 상기 최적화 하기 위한 명령은, 심층 강화 학습 모델을 이용한 알고리즘에 의해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하는 것으로, 각 타임 슬롯 t에서 F-IRS의 위치 정보와 사용자 단말의 위치 정보를 포함하는 상태 s(t)에 대한 정보를 상기 심층 강화 학습 모델로 입력하여 상기 상태 s(t)에 대응하는 행동 a(t)을 결정하도록 하며, 상기 행동 a(t)는 해당 타임 슬롯의 플라잉 지능형 반사면의 파라미터(,)를 포함하는, 컴퓨팅 장치.(수학식)(F-IRS의 행동 공간의 제약 조건): 타임 슬롯 t에서 F-IRS가 움직이는 시간: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 방위각: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 고도각: 타임 슬롯 t에서 F-IRS의 반사 소자 n에서의 위상 천이 값Rk : 사용자 단말에서 달성 가능한 비율(Achievable Rate)K : 사용자 단말의 전체 개수n : F-IRS의 반사 소자 |
| 9 | 기지국;플라잉 지능형 반사면(Flying Intelligent Reflecting Surface: F-IRS); 및 복수의 사용자 단말을 포함하고, 상기 기지국은,상기 기지국에서 송신한 신호를 플라잉 지능형 반사면을 통해 사용자 단말이 수신하는 경우 상기 사용자 단말의 수신 신호를 산출하고, 상기 수신 신호에 기초한 상기 사용자 단말의 ASSR(Achievable System Sum Rate)을 최대화 하도록 상기 플라잉 지능형 반사면의 기 설정된 파라미터들을 최적화 하며,상기 기지국은, 하기 수학식 및 F-IRS의 행동 공간의 제약 조건을 통해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하되, 심층 강화 학습 모델을 이용한 알고리즘에 의해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하는 것으로, 각 타임 슬롯 t에서 F-IRS의 위치 정보와 사용자 단말의 위치 정보를 포함하는 상태 s(t)에 대한 정보를 상기 심층 강화 학습 모델로 입력하여 상기 상태 s(t)에 대응하는 행동 a(t)을 결정하도록 하며, 상기 행동 a(t)는 해당 타임 슬롯의 플라잉 지능형 반사면의 파라미터(,)를 포함하는, 통신 시스템.(수학식)(F-IRS의 행동 공간의 제약 조건): 타임 슬롯 t에서 F-IRS가 움직이는 시간: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 방위각: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 고도각: 타임 슬롯 t에서 F-IRS의 반사 소자 n에서의 위상 천이 값Rk : 사용자 단말에서 달성 가능한 비율(Achievable Rate)K : 사용자 단말의 전체 개수n : F-IRS의 반사 소자 |
| 10 | 기지국, 플라잉 지능형 반사면(Flying Intelligent Reflecting Surface: F-IRS), 및 복수의 사용자 단말을 포함하는 통신 시스템의 통신 방법을 수행하기 위한 명령어들을 포함하고, 비일시적 컴퓨터 판독 가능한 저장 매체(non-transitory computer readable storage medium)에 저장된 컴퓨터 프로그램으로서, 상기 명령어들은 하나 이상의 프로세서들을 갖는 컴퓨팅 장치에 의해 실행될 때, 상기 컴퓨팅 장치로 하여금, 기지국에서 송신한 신호를 플라잉 지능형 반사면을 통해 사용자 단말이 수신하는 경우 상기 사용자 단말의 수신 신호를 산출하는 단계; 및상기 수신 신호에 기초한 상기 사용자 단말의 ASSR(Achievable System Sum Rate)을 최대화 하도록 상기 플라잉 지능형 반사면의 기 설정된 파라미터들을 최적화 하는 단계를 수행하도록 하며,상기 최적화 하는 단계는, 하기 수학식 및 F-IRS의 행동 공간의 제약 조건을 통해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하되, 상기 최적화 하는 단계는, 심층 강화 학습 모델을 이용한 알고리즘에 의해 상기 플라잉 지능형 반사면의 파라미터(,)들을 최적화 하는 것으로, 각 타임 슬롯 t에서 F-IRS의 위치 정보와 사용자 단말의 위치 정보를 포함하는 상태 s(t)에 대한 정보를 상기 심층 강화 학습 모델로 입력하여 상기 상태 s(t)에 대응하는 행동 a(t)을 결정하도록 하며, 상기 행동 a(t)는 해당 타임 슬롯의 플라잉 지능형 반사면의 파라미터(,)를 포함하는, 컴퓨터 프로그램.(수학식)(F-IRS의 행동 공간의 제약 조건): 타임 슬롯 t에서 F-IRS가 움직이는 시간: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 방위각: 타임 슬롯 t에서 F-IRS의 움직임 방향을 나타내는 고도각: 타임 슬롯 t에서 F-IRS의 반사 소자 n에서의 위상 천이 값Rk : 사용자 단말에서 달성 가능한 비율(Achievable Rate)K : 사용자 단말의 전체 개수n : F-IRS의 반사 소자 |