[PATCH 1/5] drm/radeon: separate gart and vm functions (original) (raw)

Mon Feb 24 09:42:39 PST 2014

  /* allocate enough for 2 full VM pts */
  size = radeon_vm_directory_size(rdev);
  size += rdev->vm_manager.max_pfn * 8;
  size *= 2;
  r = radeon_sa_bo_manager_init(rdev, &rdev->vm_manager.sa_manager,
                 RADEON_GPU_PAGE_ALIGN(size),
                 RADEON_VM_PTB_ALIGN_SIZE,
                 RADEON_GEM_DOMAIN_VRAM);
  if (r) {
     dev_err(rdev->dev, "failed to allocate vm bo (%dKB)\n",
        (rdev->vm_manager.max_pfn * 8) >> 10);
     return r;
  }
  r = radeon_asic_vm_init(rdev);
  if (r)
     return r;
  rdev->vm_manager.enabled = true;
  r = radeon_sa_bo_manager_start(rdev, &rdev->vm_manager.sa_manager);
  if (r)
     return r;
  if (vm->page_directory == NULL)
     continue;
  list_for_each_entry(bo_va, &vm->va, vm_list) {
     bo_va->valid = false;
  }
            struct radeon_vm *vm)
  return;
  bo_va->valid = false;
  return;
  radeon_sa_bo_free(rdev, &vm->page_tables[i], vm->fence);
  return;
  mutex_lock(&vm->mutex);
  radeon_vm_free_pt(rdev, vm);
  mutex_unlock(&vm->mutex);
  radeon_fence_unref(&rdev->vm_manager.active[i]);
  return -ENOMEM;
            struct radeon_vm, list);
  return -ENOMEM;
  return -EINVAL;
  return 0;
          &vm->page_directory, pd_size,
          RADEON_VM_PTB_ALIGN_SIZE, false);
  r = radeon_vm_evict(rdev, vm);
  if (r)
     return r;
  goto retry;
  return r;
       NULL, pd_entries * 2 + 64);
  radeon_sa_bo_free(rdev, &vm->page_directory, vm->fence);
  return r;
        0, pd_entries, 0, 0);
  radeon_ib_free(rdev, &ib);
  radeon_sa_bo_free(rdev, &vm->page_directory, vm->fence);
  return r;
  DRM_ERROR("Cannot allocate memory for page table array\n");
  radeon_sa_bo_free(rdev, &vm->page_directory, vm->fence);
  return -ENOMEM;
               struct radeon_vm *vm, int ring)
  return NULL;
  struct radeon_fence *fence = rdev->vm_manager.active[i];
  if (fence == NULL) {
     /* found a free one */
     vm->id = i;
     trace_radeon_vm_grab_id(vm->id, ring);
     return NULL;
  }
  if (radeon_fence_is_earlier(fence, best[fence->ring])) {
     best[fence->ring] = fence;
     choices[fence->ring == ring ? 0 : 1] = i;
  }
  if (choices[i]) {
     vm->id = choices[i];
     trace_radeon_vm_grab_id(vm->id, ring);
     return rdev->vm_manager.active[choices[i]];
  }
       struct radeon_vm *vm,
       struct radeon_fence *fence)
               struct radeon_bo *bo)
  if (bo_va->vm == vm) {
     return bo_va;
  }
              struct radeon_vm *vm,
              struct radeon_bo *bo)
  return NULL;
       struct radeon_bo_va *bo_va,
       uint64_t soffset,
       uint32_t flags)
  /* make sure object fit at this offset */
  eoffset = soffset + size;
  if (soffset >= eoffset) {
     return -EINVAL;
  }
  last_pfn = eoffset / RADEON_GPU_PAGE_SIZE;
  if (last_pfn > rdev->vm_manager.max_pfn) {
     dev_err(rdev->dev, "va above limit (0x%08X > 0x%08X)\n",
        last_pfn, rdev->vm_manager.max_pfn);
     return -EINVAL;
  }
  eoffset = last_pfn = 0;
  if (bo_va == tmp) {
     /* skip over currently modified bo */
     continue;
  }
  if (soffset >= last_offset && eoffset <= tmp->soffset) {
     /* bo can be added before this one */
     break;
  }
  if (eoffset > tmp->soffset && soffset < tmp->eoffset) {
     /* bo and tmp overlap, invalid offset */
     dev_err(rdev->dev, "bo %p va 0x%08X conflict with (bo %p 0x%08X 0x%08X)\n",
        bo_va->bo, (unsigned)bo_va->soffset, tmp->bo,
        (unsigned)tmp->soffset, (unsigned)tmp->eoffset);
     mutex_unlock(&vm->mutex);
     return -EINVAL;
  }
  last_offset = tmp->eoffset;
  head = &tmp->vm_list;
   uint32_t hw_flags = 0;
   hw_flags |= (flags & RADEON_VM_PAGE_VALID) ? R600_PTE_VALID : 0;
   hw_flags |= (flags & RADEON_VM_PAGE_READABLE) ? R600_PTE_READABLE : 0;
   hw_flags |= (flags & RADEON_VM_PAGE_WRITEABLE) ? R600_PTE_WRITEABLE : 0;
   if (flags & RADEON_VM_PAGE_SYSTEM) {
           hw_flags |= R600_PTE_SYSTEM;
           hw_flags |= (flags & RADEON_VM_PAGE_SNOOPED) ? R600_PTE_SNOOPED : 0;
   }
   return hw_flags;
  uint64_t pde, pt;
  if (vm->page_tables[pt_idx])
     continue;
  r = radeon_sa_bo_new(rdev, &rdev->vm_manager.sa_manager,
             &vm->page_tables[pt_idx],
             RADEON_VM_PTE_COUNT * 8,
             RADEON_GPU_PAGE_SIZE, false);
  if (r == -ENOMEM) {
     r = radeon_vm_evict(rdev, vm);
     if (r)
        return r;
     goto retry;
  } else if (r) {
     return r;
  }
  pde = vm->pd_gpu_addr + pt_idx * 8;
  pt = radeon_sa_bo_gpu_addr(vm->page_tables[pt_idx]);
  if (((last_pde + 8 * count) != pde) ||
      ((last_pt + incr * count) != pt)) {
     if (count) {
        radeon_asic_vm_set_page(rdev, ib, last_pde,
                 last_pt, count, incr,
                 R600_PTE_VALID);
        count *= RADEON_VM_PTE_COUNT;
        radeon_asic_vm_set_page(rdev, ib, last_pt, 0,
                 count, 0, 0);
     }
     count = 1;
     last_pde = pde;
     last_pt = pt;
  } else {
     ++count;
  }
  radeon_asic_vm_set_page(rdev, ib, last_pde, last_pt, count,
           incr, R600_PTE_VALID);
  count *= RADEON_VM_PTE_COUNT;
  radeon_asic_vm_set_page(rdev, ib, last_pt, 0,
           count, 0, 0);
          struct radeon_vm *vm,
          struct radeon_ib *ib,
          uint64_t start, uint64_t end,
          uint64_t dst, uint32_t flags)
  uint64_t pt_idx = addr >> RADEON_VM_BLOCK_SIZE;
  unsigned nptes;
  uint64_t pte;
  if ((addr & ~mask) == (end & ~mask))
     nptes = end - addr;
  else
     nptes = RADEON_VM_PTE_COUNT - (addr & mask);
  pte = radeon_sa_bo_gpu_addr(vm->page_tables[pt_idx]);
  pte += (addr & mask) * 8;
  if ((last_pte + 8 * count) != pte) {
     if (count) {
        radeon_asic_vm_set_page(rdev, ib, last_pte,
                 last_dst, count,
                 RADEON_GPU_PAGE_SIZE,
                 flags);
     }
     count = nptes;
     last_pte = pte;
     last_dst = dst;
  } else {
     count += nptes;
  }
  addr += nptes;
  dst += nptes * RADEON_GPU_PAGE_SIZE;
  radeon_asic_vm_set_page(rdev, ib, last_pte,
           last_dst, count,
           RADEON_GPU_PAGE_SIZE, flags);
     struct radeon_vm *vm,
     struct radeon_bo *bo,
     struct ttm_mem_reg *mem)
  return 0;
  dev_err(rdev->dev, "bo %p not in vm %p\n", bo, vm);
  return -EINVAL;
  dev_err(rdev->dev, "bo %p don't has a mapping in vm %p\n",
     bo, vm);
  return -EINVAL;
  return 0;
  addr = mem->start << PAGE_SHIFT;
  if (mem->mem_type != TTM_PL_SYSTEM) {
     bo_va->flags |= RADEON_VM_PAGE_VALID;
     bo_va->valid = true;
  }
  if (mem->mem_type == TTM_PL_TT) {
     bo_va->flags |= RADEON_VM_PAGE_SYSTEM;
  } else {
     addr += rdev->vm_manager.vram_base_offset;
  }
  addr = 0;
  bo_va->valid = false;
  /* reserve space for one header for every 2k dwords */
  ndw += (nptes >> 11) * 4;
  /* reserve space for one header for
      every (1 << BLOCK_SIZE) entries */
  ndw += (nptes >> RADEON_VM_BLOCK_SIZE) * 4;
  return -ENOMEM;
  return r;
  radeon_ib_free(rdev, &ib);
  return r;
           addr, radeon_vm_page_flags(bo_va->flags));
  radeon_ib_free(rdev, &ib);
  return r;
       struct radeon_bo_va *bo_va)
  r = radeon_vm_bo_update(rdev, bo_va->vm, bo_va->bo, NULL);
          struct radeon_bo *bo)
  bo_va->valid = false;
  dev_err(rdev->dev, "still active bo inside vm\n");
  list_del_init(&bo_va->vm_list);
  r = radeon_bo_reserve(bo_va->bo, false);
  if (!r) {
     list_del_init(&bo_va->bo_list);
     radeon_bo_unreserve(bo_va->bo);
     kfree(bo_va);
  }
     Alex Deucher
     Jerome Glisse
  /* allocate enough for 2 full VM pts */
  size = radeon_vm_directory_size(rdev);
  size += rdev->vm_manager.max_pfn * 8;
  size *= 2;
  r = radeon_sa_bo_manager_init(rdev, &rdev->vm_manager.sa_manager,
                 RADEON_GPU_PAGE_ALIGN(size),
                 RADEON_VM_PTB_ALIGN_SIZE,
                 RADEON_GEM_DOMAIN_VRAM);
  if (r) {
     dev_err(rdev->dev, "failed to allocate vm bo (%dKB)\n",
        (rdev->vm_manager.max_pfn * 8) >> 10);
     return r;
  }
  r = radeon_asic_vm_init(rdev);
  if (r)
     return r;
  rdev->vm_manager.enabled = true;
  r = radeon_sa_bo_manager_start(rdev, &rdev->vm_manager.sa_manager);
  if (r)
     return r;
  if (vm->page_directory == NULL)
     continue;
  list_for_each_entry(bo_va, &vm->va, vm_list) {
     bo_va->valid = false;
  }
            struct radeon_vm *vm)

[PATCH 1/5] drm/radeon: separate gart and vm functions (original) (raw)

Signed-off-by: Christian König <christian.koenig at amd.com> Reviewed-by: Alex Deucher <alexander.deucher at amd.com>

-/* - * vm helpers - * - * TODO bind a default page at vm initialization for default address - */

-{ - struct radeon_bo_va *bo_va; - int i;

-{ - struct radeon_fence *best[RADEON_NUM_RINGS] = {}; - unsigned choices[2] = {}; - unsigned i;

-{ - radeon_fence_unref(&rdev->vm_manager.active[vm->id]); - rdev->vm_manager.active[vm->id] = radeon_fence_ref(fence);

-{ - struct radeon_bo_va *bo_va;

-{ - struct radeon_bo_va *bo_va;

-{ - uint64_t size = radeon_bo_size(bo_va->bo); - uint64_t eoffset, last_offset = 0; - struct radeon_vm vm = bo_va->vm; - struct radeon_bo_va tmp; - struct list_head *head; - unsigned last_pfn;

-}

-{ - static const uint64_t mask = RADEON_VM_PTE_COUNT - 1;

-{ - struct radeon_ib ib; - struct radeon_bo_va *bo_va; - unsigned nptes, npdes, ndw; - uint64_t addr; - int r;

-{ - int r = 0;

-{ - struct radeon_bo_va *bo_va;

[PATCH 1/5] drm/radeon: separate gart and vm functions (original) (raw)

Signed-off-by: Christian König <christian.koenig at amd.com> Reviewed-by: Alex Deucher <alexander.deucher at amd.com>

-/* - * vm helpers - * - * TODO bind a default page at vm initialization for default address - */

-{ - struct radeon_bo_va *bo_va; - int i;

-{ - struct radeon_fence *best[RADEON_NUM_RINGS] = {}; - unsigned choices[2] = {}; - unsigned i;

-{ - radeon_fence_unref(&rdev->vm_manager.active[vm->id]); - rdev->vm_manager.active[vm->id] = radeon_fence_ref(fence);

-{ - struct radeon_bo_va *bo_va;

-{ - struct radeon_bo_va *bo_va;

-{ - uint64_t size = radeon_bo_size(bo_va->bo); - uint64_t eoffset, last_offset = 0; - struct radeon_vm *vm = bo_va->vm; - struct radeon_bo_va *tmp; - struct list_head *head; - unsigned last_pfn;

-}

-{ - static const uint64_t mask = RADEON_VM_PTE_COUNT - 1;

-{ - struct radeon_ib ib; - struct radeon_bo_va *bo_va; - unsigned nptes, npdes, ndw; - uint64_t addr; - int r;

-{ - int r = 0;

-{ - struct radeon_bo_va *bo_va;

-{ - uint64_t size = radeon_bo_size(bo_va->bo); - uint64_t eoffset, last_offset = 0; - struct radeon_vm vm = bo_va->vm; - struct radeon_bo_va tmp; - struct list_head *head; - unsigned last_pfn;