2025-04-24

关于cbs调度算法，我们上面知道了其默认基于edf，以截止时间作为优先级，每个任务都有预算，当预算完成时任务也完成了，那么更新预算，重新周期，如果任务的unblock后的剩余占比大于设置预算设置占比，则将任务推迟运行。
本文基于rtems的测试用例，简单演示一下cbs调度算法

测试代码

为了支持测试，我们需要创建四个任务，这个比较常规，使用 rtems_task_create和rtems_task_start即可
在cbs中，我们需要额外调用rtems_cbs_initialize即可。那么代码如下


  for ( index = 1 ; index <= NUM_TASKS ; index++ ) {
    status = rtems_task_create(
      Task_name[ index ],
      Priorities[ index ],
      RTEMS_MINIMUM_STACK_SIZE * 4,
      RTEMS_DEFAULT_MODES,
      RTEMS_DEFAULT_ATTRIBUTES,
      &Task_id[ index ]
    );
    directive_failed( status, "rtems_task_create loop" );
  }

  rtems_cbs_initialize();

  for ( index = 1 ; index <= NUM_PERIODIC_TASKS ; index++ ) {
    status = rtems_task_start( Task_id[ index ], Tasks_Periodic, index );
    directive_failed( status, "rtems_task_start loop" );
  }

根据上面，任务开始时会默认调用Tasks_Periodic，我们在这里设置任务

首先，我们需要按照edf的规范，设置周期，主要调用如下


rtems_rate_monotonic_create
rtems_rate_monotonic_ident
rtems_rate_monotonic_period

对于cbs而言，我们需要预设deadline和budget，并且如果任务超限，也就是cpu利用率大于1时，我们可以设置一个函数回调，如下


params.deadline = Periods[ argument ];
params.budget = Execution[ argument ]+1;
rtems_cbs_create_server( &params, &overrun_handler_task_4, &server_id )

如果我们需要在任务运行的时候，重设cbs的预算和截止时间，可以使用如下函数


rtems_cbs_set_parameters

至此，我们的测试程序如下


rtems_task Tasks_Periodic(
  rtems_task_argument argument
)
{
  rtems_id          rmid;
  rtems_id          test_rmid;
  rtems_status_code status;
  bool              scenario_done = 0;

  int start, stop, now;

  rtems_cbs_server_id server_id, tsid;
  rtems_cbs_parameters params, tparams;

  params.deadline = Periods[ argument ];
  params.budget = Execution[ argument ]+1;

  if ( argument == 4 ) {
    if ( rtems_cbs_create_server( &params, &overrun_handler_task_4, &server_id ))
      printf( "ERROR: CREATE SERVER FAILED\n" );
  }
  else {
    if ( rtems_cbs_create_server( &params, NULL, &server_id ) )
      printf( "ERROR: CREATE SERVER FAILED\n" );
  }
  if ( rtems_cbs_attach_thread( server_id, Task_id[ argument ] ) )
    printf( "ERROR: ATTACH THREAD FAILED\n" );
  if ( rtems_cbs_get_server_id( Task_id[ argument ], &tsid ) )
    printf( "ERROR: GET SERVER ID FAILED\n" );
  if ( tsid != server_id )
    printf( "ERROR: SERVER ID MISMATCH\n" );
  if ( rtems_cbs_get_parameters( server_id, &tparams ) )
    printf( "ERROR: GET PARAMETERS FAILED\n" );
  if ( params.deadline != tparams.deadline ||
       params.budget != tparams.budget )
    printf( "ERROR: PARAMETERS MISMATCH\n" );

  status = rtems_rate_monotonic_create( argument, &rmid );
  directive_failed( status, "rtems_rate_monotonic_create" );
  put_name( Task_name[ argument ], FALSE );
  printf( "- rtems_rate_monotonic_create id = 0x%08" PRIxrtems_id "\n",
          rmid );

  status = rtems_rate_monotonic_ident( argument, &test_rmid );
  directive_failed( status, "rtems_rate_monotonic_ident" );
  put_name( Task_name[ argument ], FALSE );
  printf( "- rtems_rate_monotonic_ident id = 0x%08" PRIxrtems_id "\n",
          test_rmid );

  if ( rmid != test_rmid ) {
     printf( "RMID's DO NOT MATCH (0x%" PRIxrtems_id " and 0x%"
             PRIxrtems_id ")\n", rmid, test_rmid );
     rtems_test_exit( 0 );
  }

  put_name( Task_name[ argument ], FALSE );
  printf( "- (0x%08" PRIxrtems_id ") period %" PRIu32 "\n",
          rmid, Periods[ argument ] );

  status = rtems_task_wake_after( 2 + Phases[argument] );
  directive_failed( status, "rtems_task_wake_after" );

  while (FOREVER) {
    if (rtems_rate_monotonic_period(rmid, Periods[argument])==RTEMS_TIMEOUT)
      printf("P%" PRIdPTR " - Deadline miss\n", argument);

    start = rtems_clock_get_ticks_since_boot();
    printf("P%" PRIdPTR "-S ticks:%d\n", argument, start);
    if ( start >= 2*HP_LENGTH ) break; /* stop */

    /* Specific scenario for task 4: tries to exceed announced budget,
       the task priority has to be pulled down to background. */
    now = rtems_clock_get_ticks_since_boot();
    if ( !scenario_done && argument == 4 && now >= 200 ) {
      Violating_task[ argument ] = 1;
      scenario_done = 1;
    }
    /* Specific scenario for task 3: changes scheduling parameters. */
    if ( !scenario_done && argument == 3 && now >= 250 ) {
      Periods[ argument ]   = Periods[ argument ] * 2;
      Execution[ argument ] = Execution[ argument ] * 2;
      params.deadline = Periods[ argument ];
      params.budget   = Execution[ argument ]+1;
      if ( rtems_cbs_set_parameters( server_id, &params) )
        printf( "ERROR: SET PARAMETERS FAILED\n" );
      if ( rtems_cbs_get_parameters( server_id, &tparams ) )
        printf( "ERROR: GET PARAMETERS FAILED\n" );
      if ( params.deadline != tparams.deadline ||
           params.budget != tparams.budget )
        printf( "ERROR: PARAMETERS MISMATCH\n" );
      scenario_done = 1;
    }
    /* Specific scenario for task 2: late unblock after being blocked by
       itself, the task priority has to be pulled down to background. */
    if ( !scenario_done && argument == 2 && now >= 500 ) {
      Violating_task[ argument ] = 1;
      scenario_done = 1;
    }
    if (argument == 2 && Violating_task[ argument ])
      rtems_task_wake_after( 10 );

    /* active computing */
    while(FOREVER) {
      now = rtems_clock_get_ticks_since_boot();
      if ( argument == 4 && !Violating_task[ argument ] &&
          (now >= start + Execution[argument]))
        break;
      if ( argument != 4 && (now >= start + Execution[argument]) )
        break;
    }
    stop = rtems_clock_get_ticks_since_boot();
    printf("P%" PRIdPTR "-F ticks:%d\n", argument, stop);
  }

  /* delete period and SELF */
  status = rtems_rate_monotonic_delete( rmid );
  if ( status != RTEMS_SUCCESSFUL ) {
    printf("rtems_rate_monotonic_delete failed with status of %d.\n",status);
    rtems_test_exit( 0 );
  }
  if ( rtems_cbs_cleanup() )
    printf( "ERROR: CBS CLEANUP\n" );
  fflush(stdout);
  TEST_END();
  rtems_test_exit( 0 );
}

代码比较容易理解，下面运行查看日志

日志


*** TEST CBS SCHEDULER 3 ***
PT1 - rtems_rate_monotonic_create id = 0x42010001
PT1 - rtems_rate_monotonic_ident id = 0x42010001
PT1 - (0x42010001) period 30
PT2 - rtems_rate_monotonic_create id = 0x42010002
PT2 - rtems_rate_monotonic_ident id = 0x42010002
PT2 - (0x42010002) period 40
PT3 - rtems_rate_monotonic_create id = 0x42010003
PT3 - rtems_rate_monotonic_ident id = 0x42010003
PT3 - (0x42010003) period 50
PT4 - rtems_rate_monotonic_create id = 0x42010004
PT4 - rtems_rate_monotonic_ident id = 0x42010004
PT4 - (0x42010004) period 70
AT5 AT6 P1-S ticks:2
P1-F ticks:12
P2-S ticks:12
P2-F ticks:22
P3-S ticks:22
P1-S ticks:32
P1-F ticks:42
P3-F ticks:42
P4-S ticks:42
P2-S ticks:52
P2-F ticks:62
P1-S ticks:62
P1-F ticks:72
P4-F ticks:72
P3-S ticks:72
P3-F ticks:82
AT6-S ticks:82
P6-F ticks:87
Killing task 6
AT5-S ticks:87
P1-S ticks:92
P1-F ticks:102
P2-S ticks:102
P2-F ticks:112
P4-S ticks:112
P1-S ticks:122
P1-F ticks:132
P3-S ticks:132
P3-F ticks:142
P2-S ticks:142
P2-F ticks:152
P4-F ticks:152
P1-S ticks:152
P1-F ticks:162
P2-S ticks:172
P2-F ticks:182
P1-S ticks:182
P1-F ticks:192
P3-S ticks:192
P3-F ticks:202
P4-S ticks:202
P1-S ticks:212
P1-F ticks:222
P4-F ticks:222
P2-S ticks:222
P2-F ticks:232
P3-S ticks:232
P3-F ticks:242
P1-S ticks:242
P1-F ticks:252
P2-S ticks:252
P2-F ticks:262
P4-S ticks:262
P1-S ticks:272
P1-F ticks:282
P3-S ticks:283
P3-F ticks:293
P2-S ticks:293
P2-F ticks:303
P1-S ticks:303
P1-F ticks:313
Signal overrun, fixing the task
P4-F ticks:313
P5-F ticks:313
Killing task 5
P3-S ticks:322
P1-S ticks:332
P1-F ticks:342
P3-F ticks:342
P2-S ticks:342
P2-F ticks:352
P4-S ticks:352
P4-F ticks:362
P1-S ticks:362
P1-F ticks:372
P2-S ticks:372
P2-F ticks:382
P3-S ticks:382
P1-S ticks:392
P1-F ticks:402
P4-S ticks:402
P2-S ticks:412
P2-F ticks:422
P1-S ticks:422
P1-F ticks:432
P4-F ticks:432
P3-F ticks:432
P1-S ticks:452
P1-F ticks:462
P2-S ticks:462
P2-F ticks:472
P4-S ticks:472
P1-S ticks:482
P1-F ticks:492
P4-F ticks:492
P2-S ticks:492
P2-F ticks:502
P3-S ticks:502
P1-S ticks:512
P1-F ticks:522
P3-F ticks:522
P2-S ticks:532
P4-S ticks:532
P1-S ticks:542
P1-F ticks:552
P4-F ticks:552
P2-F ticks:552
P1-S ticks:572
P1-F ticks:582
P2-S ticks:582
P3-S ticks:582
P1-S ticks:602
P1-F ticks:612
P3-F ticks:612
P4-S ticks:612
P4-F ticks:622
P2-F ticks:622
P2 - Deadline miss
P2-S ticks:622
P1-S ticks:632
P1-F ticks:642
P2-F ticks:642
P1-S ticks:662
P1-F ticks:672
P2-S ticks:672
P4-S ticks:672
P4-F ticks:682
P3-S ticks:682
P1-S ticks:692
P1-F ticks:702
P3-F ticks:702
P2-F ticks:702
P2 - Deadline miss
P2-S ticks:702
P2-F ticks:712
P1-S ticks:722
P1-F ticks:732
P2-S ticks:742
P4-S ticks:742
P1-S ticks:752
P1-F ticks:762
P4-F ticks:762
P2-F ticks:762
P3-S ticks:772
P1-S ticks:782
P1-F ticks:792
P2-S ticks:792
P3-F ticks:792
P2-F ticks:802
P1-S ticks:812
P1-F ticks:822
P2-S ticks:822
P4-S ticks:822
P4-F ticks:832
P2-F ticks:832
P1-S ticks:842
*** END OF TEST CBS SCHEDULER 3 ***

我们简单分析一下

首先，任务按照1>2>3>4的优先级运行，并且每个任务都会在自己周期内完成，我们可以留意0-82 ticks
然后，我们知道任务如果紧张，那么任务4在不能在周期内完成，那么overrun回调就会调用，例如任务4上次完成是222，下次完成在313时，花费了91ticks，故看到日志Signal overrun, fixing the task
最后，当任务在周期内，一直得不到优先级执行，那么当deadline达到的时候，在周期函数内会返回timeout，代表任务未在deadline中执行完毕，故看到从p2的ticks 582开始，到ticks 622之间，我们发现p2的任务一直被p3，p1，p4占用，导致最后p2在deadline上无法正常运行。

总结

至此，我们演示清楚了cbs调度器的示例，希望可以加深大家对cbs调度算法的理解

阅读全文

RTEMS调度器-恒定带宽(CBS)调度算法

编辑

2025-04-23

记录知识

根据之前的介绍，我们了解了edf调度算法，edf调度算法能够在理论上实现cpu利用率100%，也是单核性能最强的调度算法，因为edf算法基于deadline来控制调度的优先级，但是同样的，也是因为edf关于deadline的设计，我们使用这个算法的时候必须对任务的执行时间严格确定，也就是预设的周期内，任务是一定要完成的。如果deadline时间内，任务因为例如io问题导致延迟了，那么就会影响后面所有的任务的调度。从极端角度考虑，可能会导致deadline往后的任务，也就是优先级最低的任务，一直被饿死。
为了改善这个问题，cbs算法基于edf之上做了改进，本文介绍cbs算法

什么是cbs算法

cbs：constant bandwidth server。可以看到说明，cbs严格意义上只算一个服务，它用来改进edf算法，那么cbs支持哪些特性呢，如下：

为任务新增一个预算，此预算除以周期就是恒定带宽
如果任务的预算耗尽，但是任务没完成，则推迟deadline，降低任务优先级，让其他任务有机会运行
如果任务在周期内完成，则在下一个周期中，重新设置预算，重新运行，此预算就是其任务运行时间。

根据上面的描述，我们可以发现，cbs调度算法是一种更柔和的edf算法，如果我们的任务没办法确定固定的执行周期，也就是没办法保证任务在预设的周期内完成，那么edf算法就会像多米诺骨牌一样，一个任务延迟会导致其他所有的任务延迟。这种损坏是灾难性的。而cbs就不一样了，如果一个任务延迟，那么就会将其取消，然后降低其优先级。这样它就不会导致整个调度器上的就绪任务全部推迟。

rtems上的cbs调度算法

上面介绍清楚了cbs调度，它是edf的改进。接下来我们看一下rtems的cbs实现，如下


#define SCHEDULER_CBS_ENTRY_POINTS \
  { \
    _Scheduler_EDF_Initialize,       /* initialize entry point */ \
    _Scheduler_EDF_Schedule,         /* schedule entry point */ \
    _Scheduler_EDF_Yield,            /* yield entry point */ \
    _Scheduler_EDF_Block,            /* block entry point */ \
    _Scheduler_CBS_Unblock,          /* unblock entry point */ \
    _Scheduler_EDF_Update_priority,  /* update priority entry point */ \
    _Scheduler_EDF_Map_priority,     /* map priority entry point */ \
    _Scheduler_EDF_Unmap_priority,   /* unmap priority entry point */ \
    SCHEDULER_DEFAULT_SMP_OPERATIONS \
    _Scheduler_CBS_Node_initialize,  /* node initialize entry point */ \
    _Scheduler_default_Node_destroy, /* node destroy entry point */ \
    _Scheduler_CBS_Release_job,      /* new period of task */ \
    _Scheduler_CBS_Cancel_job,       /* cancel period of task */ \
    _Scheduler_default_Start_idle    /* start idle entry point */ \
    SCHEDULER_DEFAULT_SET_AFFINITY_OPERATION \
  }

可以发现，cbs上对任务的初始化，恢复阻塞，新增任务和取消任务做了改进。对于调度node的初始化，它新增了一个cbs的结构体，记录任务的deadline和budget，并提供一个当预算超时的函数回调。如下


typedef struct {
  /** Relative deadline of the server. */
  time_t deadline;
  /** Budget (computation time) of the server. */
  time_t budget;
} Scheduler_CBS_Parameters;
typedef struct {
  /**
   * Task id.
   *
   * @note: The current implementation of CBS handles only one task per server.
   */
  rtems_id                 task_id;
  /** Server paramenters. */
  Scheduler_CBS_Parameters parameters;
  /** Callback function invoked when a budget overrun occurs. */
  Scheduler_CBS_Budget_overrun  cbs_budget_overrun;

  /**
   * @brief Indicates if this CBS server is initialized.
   *
   * @see _Scheduler_CBS_Create_server() and _Scheduler_CBS_Destroy_server().
   */
  bool initialized;
} Scheduler_CBS_Server;

对于任务周期的开始，cbs相比于edf仅多做两件事

给任务节点设置一个预算
将任务的周期设置为deadline优先级节点

对于任务的取消，那么直接取消deadline的优先级节点即可

对于任务的解除阻塞，此实现比较重要，其函数如下


void _Scheduler_CBS_Unblock(
  const Scheduler_Control *scheduler,
  Thread_Control          *the_thread,
  Scheduler_Node          *node
)
{
  Scheduler_CBS_Node   *the_node;
  Scheduler_CBS_Server *serv_info;
  Priority_Control      priority;

  the_node = _Scheduler_CBS_Node_downcast( node );
  serv_info = the_node->cbs_server;
  priority = _Scheduler_Node_get_priority( &the_node->Base.Base );
  priority = SCHEDULER_PRIORITY_PURIFY( priority );

  /*
   * Late unblock rule for deadline-driven tasks. The remaining time to
   * deadline must be sufficient to serve the remaining computation time
   * without increased utilization of this task. It might cause a deadline
   * miss of another task.
   */
  if ( serv_info != NULL && ( priority & SCHEDULER_EDF_PRIO_MSB ) == 0 ) {
    time_t deadline = serv_info->parameters.deadline;
    time_t budget = serv_info->parameters.budget;
    uint32_t deadline_left = the_thread->CPU_budget.available;
    Priority_Control budget_left = priority - _Watchdog_Ticks_since_boot;

    if ( deadline * budget_left > budget * deadline_left ) {
      Thread_queue_Context queue_context;

      /* Put late unblocked task to background until the end of period. */
      _Thread_queue_Context_clear_priority_updates( &queue_context );
      _Scheduler_CBS_Cancel_job(
        scheduler,
        the_thread,
        the_node->deadline_node,
        &queue_context
      );
    }
  }

  _Scheduler_EDF_Unblock( scheduler, the_thread, &the_node->Base.Base );
}

可以看到，当任务从其他阻塞状态恢复到非阻塞状态，也就是加入就绪列表的时候，它会计算四个值

deadline
budget
剩余的deadline
剩余的budget

关于deadline和预算我们知道就是任务的周期和任务的执行事件，对于剩余的deadline和budget，其实就是任务实际运行时：

相较于设置的deadline还剩余的时间
相较于设置的budget还剩余的预算

那么关键的就是如下判断


if ( deadline * budget_left > budget * deadline_left ) {

我们看到不等式如下


deadline * budget_left > budget * deadline_left

它可以替换成如下


budget_left/deadline_left > budget/deadline

那么其含义就清楚了，那就是剩余的预算除以剩余的deadline的比重如果大于预期的预算除以deadline。那么就需要重设优先级，取消任务了。
再把意思转换一下，就是：

如果budget_left占比不变，则deadline_left占比太小，也就是剩余的deadline时间不够，也就是当前任务时间不够宽裕
如果deadline_left占比不变，则budget_left占比太大，也就是剩余的预算太大

对于上述的1好理解，如果deadline比重太小了，任务可能就不可控了。那么对于2怎么理解呢？

我们知道，如果任务正常执行，不可能存在剩余的预算除以剩余的deadline的占比反而大。但是在计算机领域，我们存在IO，IO是阻塞的，在IO期间，预算的时间是不被减掉的，也就是说进入unblock的预算时间值，实际上是进入IO之前的预算时间值。那么IO的时间实际上还没有计算进去。此时如果budget_left占比太大，说明任务有一定的风险导致不可控。这就理解清楚情况2了。

那么_Scheduler_CBS_Unblock的逻辑就是，如果剩余的任务占比要比预设的任务占比大，那么调度可能失控，此时将其任务从就绪队列删除，降低其优先级

总结

至此，我们基于edf介绍了cbs调度算法，它是edf算法的改进，当意外出现的时候，它会对失控的任务降低优先级，从而不会导致整个调度失控。
接下来，我会通过示例程序演示此调度器。

2025-04-21

根据《GICv3寄存器接口》的介绍，我们知道SPI/SGI/PPI 通过Distributor 找到

2025-04-21

根据《GICv3中断简介》我们简单了解了gicv3中断控制器，这里根据《GICv3_Software_Overview_Official_Release_B.pdf》的Programmers’ model 来介绍一下gicv3的组成

整体划分

gicv3主要由三大部分组成，如下

Distributor interface
Redistributor interface
CPU interface

这里

Distributor：它检查中断源的状态，将SGI和SPI这类中断最终派发到到Redistributor上去，因为每个CPU都连接一个Redistributor，所以最终会派发到对应的CPU interface上
Redistributor：接收Distributor，然后最终将中断发送给CPU Interface
CPU interface：就是我们常规理解的中断，它将中断发给CPU，让CPU响应中断

这里Distributor派发到Redistributor是根据优先级的，所以gicv3的affinity hierarchy 图如下

所以，我们知道了gicv3的整体框图如下

对于寄存器标识，如下

GICD_* : Distributor,也就是SGI/SPI的分发
GICR_* : Redistributor，接收中断发给GICC_* ，注意PPI的中断是直接给到GICR_* 不通过GICD_*
GICC_* : CPU interface, 发送给CPU，响应中断

根据上面的介绍，其实总结一下流程就是如下

外设发起中断，发送给distributor
Distributor将该中断，然后根据优先等级分发给合适的Redistributor
Redistributor将中断发送给CPU interface。
CPU interface产生合适的中断异常给处理器
CPU接收该异常，并且软件处理该中断

其中断状态机如下

Inactive：不活跃状态
Pending：中断触发了，还没到CPU Interface，还没响应
Active：被CPU响应和处理
Active & Pending： (An instance of the interrupt has been acknowledged, and another instance is now pending. )当前有一个中断正在响应，此时有一个相同优先级的中断触发了

不过LPI中断没有active 或 active and pending 状态，也就是上面的中断状态机只针对SPI,SGI,PPI的。所以LPI的状态机如下

总结

根据上面的信息，我们中间gic-v3的寄存器调用如下图

2025-04-21

在《glibc内存malloc简要解析》就介绍了glibc的一些概念，简单来说就是将malloc返回的地址的前16字节叫做chunk header。
在我们操作系统中，遇到了一个非常奇怪的问题，那就是调用xcb的程序，总是在退出的时候，莫名其妙报glibc的错误，包含但不局限于如下


malloc_consolidate(): unaligned fastbin chunk detected
double free or corruption (!prev)
corrupted double-linked list
malloc(): memory corruption

今天介绍这个问题

先看修改


static lazyreply *get_index(xcb_connection_t *c, int idx)
{
    if(c->ext.extensions_size < 0)
        c->ext.extensions_size = 0;

    if(idx > c->ext.extensions_size)
    {
        int new_size = idx << 1;
        lazyreply *new_extensions = realloc(c->ext.extensions, sizeof(lazyreply) * new_size);
        if(!new_extensions)
            return 0;
        memset(new_extensions + c->ext.extensions_size, 0, sizeof(lazyreply) * (new_size - c->ext.extensions_size));
        c->ext.extensions = new_extensions;
        c->ext.extensions_size = new_size;
    }
    return c->ext.extensions + idx - 1;
}

这里对于extensions_size是小于0的情况，强制置0


    if(c->ext.extensions_size < 0)
        c->ext.extensions_size = 0;

我们可以看到get_index的代码，这里会将ext.extensions进行realloc，realloc之后，将新增的大小区域进行memset为0。那么问题就出现在memset上了。


memset(new_extensions + c->ext.extensions_size, 0, sizeof(lazyreply) * (new_size - c->ext.extensions_size));

我们假设extensions_size是-1，那么memset就会清空realloc申请的内存的chunk head结构体。
chunk的数据内容被清空了，那么程序可能正常，也可能在glibc的回收，规整，free，分配等操作中都会出现异常

总结

根据这个问题现象，他是一个非常随机的问题，存在此问题的系统，会给人感觉系统非常不稳定。因为xcb的应用只要运行，就会随机出错，或者大概率退出的时候出错。而且出错的日志全部指向了glibc的内存管理。
而实际上此问题就是对某个内存地址，错误的将chunk head清空了导致的。
定位这个问题也比较困难，我们需要先了解glibc的内存管理相关逻辑，然后gdb找到崩溃现场。根据glibc的逻辑，他是使用双向循环链表来管理每个chunk的bin，所以推荐使用pwndbg工具，这个工具在定位链表上非常方便。
实际上，为了找到xcb的问题，我重编了glibc，mesa，xcb，dri，xorg。甚至我还找rk拿了mali so的符号版本。
同样的，为了前期排查问题，还使用了asan来寻找内存问题。当然，浪费时间了，自己asan学艺不精。

阅读全文