유연한 이동성, 비용 효율성 및 3차원 연결성 제공과 같은 다양한 장점으로 인하여 B5G 및 6G 네트워크에서 매우 중요한 기술로 고려되고 있는 UAV-BS는 심각한 배터리 제약 문제를 가지고 있기 때문에 반드시 에너지 효율적 운용으로 라이프타임을 최대화해야 하며, 동시에 수율을 최대화할 필요가 있다. 이에 따라, 랜덤 액세스 기법과 현재 상태를 고려하여 액션을 취하고 그에 따른 보상을 통하여 학습하는 강화학습과 같은 기법을 통한 에너지 효율적 운용을 위한 많은 기법들에 대한 연구가 진행되고 있다. 본 연구에서는 랜덤 액세스에 기반하여 UAV의 잔여 에너지에 따라 패킷 전송 확률을 조정함으로써 라이프타임을 최대화한다. 또한, 기계학습 기법 중 하나인 강화학습을 기반으로 하는 알고리즘을 제안한다. 먼저, 지상으로부터 연결된 테더를 통하여 지속적으로 전력을 공급받는 TUAV-BS로 운용되는 네트워크에서 큐러닝을 통해 TUAV-BS의 위치를 최적화함으로써 수율을 최대화한다. 또한, 다중 UAV 네트워크에서 계층적 큐러닝을 통해 주파수 재사용 계수와 전송 전력을 제어함으로써 에너지 효율 및 수율을 최대화한다. 본 연구에서는 제안된 랜덤 액세스 기법과 강화학습 기반의 TUAV-BS 최적 위치 제어 기법 및 계층적 강화학습 기반 주파수 재사용 계수 및 전송 전력 최적화 기법이 기존 방안 보다 수율 및 라이프타임을 향상시킬 수 있음을 보인다.